Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 104 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 2 |
Duplicate rows (%) | 1.9% |
Total size in memory | 3.4 KiB |
Average record size in memory | 33.3 B |
Variable types
Text | 2 |
---|---|
Categorical | 2 |
Dataset
Description | 한국물기술인증원의 위생안전기준 인증등록정보망에 등록된 시료시판품(기업명, 제품, 인증번호, 결과)에 대한 정보입니다. |
---|---|
Author | 환경부 |
URL | https://www.data.go.kr/data/15071374/fileData.do |
결과 has constant value "" | Constant |
Dataset has 2 (1.9%) duplicate rows | Duplicates |
제품분류 is highly imbalanced (61.2%) | Imbalance |
Reproduction
Analysis started | 2024-05-04 08:14:40.377466 |
---|---|
Analysis finished | 2024-05-04 08:14:43.198172 |
Duration | 2.82 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
기업명
Text
Distinct | 95 |
---|---|
Distinct (%) | 91.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 964.0 B |
Value | Count | Frequency (%) |
주식회사 | 15 | 10.9% |
아이제이코리아 | 3 | 2.2% |
sj코리아 | 3 | 2.2% |
임창 | 3 | 2.2% |
co | 2 | 1.5% |
제이시엘인더스트리 | 2 | 1.5% |
주 | 2 | 1.5% |
에코수전 | 2 | 1.5% |
조은ws | 2 | 1.5% |
인포메탈 | 2 | 1.5% |
Other values (98) | 101 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 43 | 5.4% |
35 | 4.4% | |
( | 31 | 3.9% |
) | 31 | 3.9% |
이 | 29 | 3.7% |
아 | 26 | 3.3% |
코 | 21 | 2.7% |
스 | 21 | 2.7% |
리 | 19 | 2.4% |
㈜ | 18 | 2.3% |
Other values (164) | 517 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 575 | |
Uppercase Letter | 72 | 9.1% |
Space Separator | 35 | 4.4% |
Open Punctuation | 31 | 3.9% |
Close Punctuation | 31 | 3.9% |
Lowercase Letter | 21 | 2.7% |
Other Symbol | 18 | 2.3% |
Other Punctuation | 6 | 0.8% |
Decimal Number | 1 | 0.1% |
Dash Punctuation | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 43 | 7.5% |
이 | 29 | 5.0% |
아 | 26 | 4.5% |
코 | 21 | 3.7% |
스 | 21 | 3.7% |
리 | 19 | 3.3% |
사 | 18 | 3.1% |
식 | 16 | 2.8% |
회 | 15 | 2.6% |
에 | 11 | 1.9% |
Other values (121) | 356 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 8 | 11.1% |
A | 8 | 11.1% |
G | 5 | 6.9% |
W | 5 | 6.9% |
N | 4 | 5.6% |
O | 4 | 5.6% |
T | 4 | 5.6% |
D | 3 | 4.2% |
L | 3 | 4.2% |
U | 3 | 4.2% |
Other values (13) | 25 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 4 | |
t | 3 | |
s | 3 | |
a | 2 | |
r | 2 | |
m | 1 | 4.8% |
y | 1 | 4.8% |
k | 1 | 4.8% |
n | 1 | 4.8% |
h | 1 | 4.8% |
Other values (2) | 2 |
Other Punctuation
Value | Count | Frequency (%) |
. | 4 | |
, | 2 |
Space Separator
Value | Count | Frequency (%) |
35 |
Open Punctuation
Value | Count | Frequency (%) |
( | 31 |
Close Punctuation
Value | Count | Frequency (%) |
) | 31 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 18 |
Decimal Number
Value | Count | Frequency (%) |
2 | 1 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 593 | |
Common | 105 | 13.3% |
Latin | 93 | 11.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 43 | 7.3% |
이 | 29 | 4.9% |
아 | 26 | 4.4% |
코 | 21 | 3.5% |
스 | 21 | 3.5% |
리 | 19 | 3.2% |
㈜ | 18 | 3.0% |
사 | 18 | 3.0% |
식 | 16 | 2.7% |
회 | 15 | 2.5% |
Other values (122) | 367 |
Latin
Value | Count | Frequency (%) |
S | 8 | 8.6% |
A | 8 | 8.6% |
G | 5 | 5.4% |
W | 5 | 5.4% |
N | 4 | 4.3% |
O | 4 | 4.3% |
e | 4 | 4.3% |
T | 4 | 4.3% |
D | 3 | 3.2% |
t | 3 | 3.2% |
Other values (25) | 45 |
Common
Value | Count | Frequency (%) |
35 | ||
( | 31 | |
) | 31 | |
. | 4 | 3.8% |
, | 2 | 1.9% |
2 | 1 | 1.0% |
- | 1 | 1.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 575 | |
ASCII | 198 | 25.0% |
None | 18 | 2.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 43 | 7.5% |
이 | 29 | 5.0% |
아 | 26 | 4.5% |
코 | 21 | 3.7% |
스 | 21 | 3.7% |
리 | 19 | 3.3% |
사 | 18 | 3.1% |
식 | 16 | 2.8% |
회 | 15 | 2.6% |
에 | 11 | 1.9% |
Other values (121) | 356 |
ASCII
Value | Count | Frequency (%) |
35 | ||
( | 31 | |
) | 31 | |
S | 8 | 4.0% |
A | 8 | 4.0% |
G | 5 | 2.5% |
W | 5 | 2.5% |
N | 4 | 2.0% |
O | 4 | 2.0% |
. | 4 | 2.0% |
Other values (32) | 63 |
None
Value | Count | Frequency (%) |
㈜ | 18 |
제품분류
Categorical
IMBALANCE
 
Distinct | 21 |
---|---|
Distinct (%) | 20.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 964.0 B |
수도꼭지 | |
---|---|
샤워기 헤드 | 2 |
제어밸브 | 2 |
체크밸브 | 2 |
원심펌프 | 1 |
Other values (16) |
Length
Max length | 17 |
---|---|
Median length | 4 |
Mean length | 4.6346154 |
Min length | 3 |
Unique
Unique | 17 ? |
---|---|
Unique (%) | 16.3% |
Sample
1st row | 청동 밸브 |
---|---|
2nd row | 수도꼭지 |
3rd row | 수도꼭지 |
4th row | 수도꼭지 |
5th row | 수도꼭지 |
Common Values
Value | Count | Frequency (%) |
수도꼭지 | 81 | |
샤워기 헤드 | 2 | 1.9% |
제어밸브 | 2 | 1.9% |
체크밸브 | 2 | 1.9% |
원심펌프 | 1 | 1.0% |
감압밸브 | 1 | 1.0% |
수도용 스테인리스 강관 이음쇠 | 1 | 1.0% |
게이트밸브 | 1 | 1.0% |
체크밸브 | 1 | 1.0% |
일반 배관용 스테인리스 강관 | 1 | 1.0% |
Other values (11) | 11 | 10.6% |
Length
Value | Count | Frequency (%) |
수도꼭지 | 81 | |
체크밸브 | 3 | 2.5% |
스테인리스 | 3 | 2.5% |
수도용 | 2 | 1.7% |
샤워기 | 2 | 1.7% |
게이트밸브 | 2 | 1.7% |
강관 | 2 | 1.7% |
제어밸브 | 2 | 1.7% |
헤드 | 2 | 1.7% |
밸브 | 1 | 0.8% |
Other values (20) | 20 | 16.7% |
인증번호
Text
Distinct | 93 |
---|---|
Distinct (%) | 89.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 964.0 B |
Length
Max length | 14 |
---|---|
Median length | 13 |
Mean length | 13.278846 |
Min length | 13 |
Characters and Unicode
Total characters | 1381 |
---|---|
Distinct characters | 15 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 83 ? |
---|---|
Unique (%) | 79.8% |
Sample
1st row | KCW-2012-0456 |
---|---|
2nd row | KCW-2012-0230 |
3rd row | KCW-2012-0444 |
4th row | KCW-2013-0246 |
5th row | KCW-2012-0227 |
Value | Count | Frequency (%) |
kcw-2014-0005 | 3 | 2.9% |
kcw-2013-0246 | 2 | 1.9% |
kcw-2012-0440 | 2 | 1.9% |
kcw-2012-0318 | 2 | 1.9% |
kcw-2012-0369 | 2 | 1.9% |
kcw-2012-0241 | 2 | 1.9% |
kcw-2014-0054 | 2 | 1.9% |
kcw-2014-0176 | 2 | 1.9% |
kcw-2012-0328 | 2 | 1.9% |
kcw-2012-0317 | 2 | 1.9% |
Other values (76) | 83 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 264 | |
- | 208 | |
2 | 200 | |
1 | 139 | |
K | 104 | 7.5% |
C | 104 | 7.5% |
W | 104 | 7.5% |
4 | 45 | 3.3% |
3 | 40 | 2.9% |
8 | 39 | 2.8% |
Other values (5) | 134 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 832 | |
Uppercase Letter | 312 | 22.6% |
Dash Punctuation | 208 | 15.1% |
Space Separator | 29 | 2.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 264 | |
2 | 200 | |
1 | 139 | |
4 | 45 | 5.4% |
3 | 40 | 4.8% |
8 | 39 | 4.7% |
6 | 29 | 3.5% |
7 | 29 | 3.5% |
5 | 24 | 2.9% |
9 | 23 | 2.8% |
Uppercase Letter
Value | Count | Frequency (%) |
K | 104 | |
C | 104 | |
W | 104 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 208 |
Space Separator
Value | Count | Frequency (%) |
29 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 1069 | |
Latin | 312 | 22.6% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 264 | |
- | 208 | |
2 | 200 | |
1 | 139 | |
4 | 45 | 4.2% |
3 | 40 | 3.7% |
8 | 39 | 3.6% |
29 | 2.7% | |
6 | 29 | 2.7% |
7 | 29 | 2.7% |
Other values (2) | 47 | 4.4% |
Latin
Value | Count | Frequency (%) |
K | 104 | |
C | 104 | |
W | 104 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 1381 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 264 | |
- | 208 | |
2 | 200 | |
1 | 139 | |
K | 104 | 7.5% |
C | 104 | 7.5% |
W | 104 | 7.5% |
4 | 45 | 3.3% |
3 | 40 | 2.9% |
8 | 39 | 2.8% |
Other values (5) | 134 |
결과
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 964.0 B |
부적합 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 부적합 |
---|---|
2nd row | 부적합 |
3rd row | 부적합 |
4th row | 부적합 |
5th row | 부적합 |
Common Values
Value | Count | Frequency (%) |
부적합 | 104 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
부적합 | 104 |
기업명 | 제품분류 | 인증번호 | |
---|---|---|---|
기업명 | 1.000 | 1.000 | 0.989 |
제품분류 | 1.000 | 1.000 | 1.000 |
인증번호 | 0.989 | 1.000 | 1.000 |
기업명 | 제품분류 | 인증번호 | 결과 | |
---|---|---|---|---|
0 | 삼효금속공업㈜ | 청동 밸브 | KCW-2012-0456 | 부적합 |
1 | 대림통상㈜금구공장 | 수도꼭지 | KCW-2012-0230 | 부적합 |
2 | 케이에프(KF) | 수도꼭지 | KCW-2012-0444 | 부적합 |
3 | 대원 | 수도꼭지 | KCW-2013-0246 | 부적합 |
4 | 제일금속공업사 | 수도꼭지 | KCW-2012-0227 | 부적합 |
5 | ㈜제이시엘인더스트리 | 수도꼭지 | KCW-2014-0005 | 부적합 |
6 | KWC Franke Water Systems AG | 수도꼭지 | KCW-2015-0028 | 부적합 |
7 | ㈜디아 | 수도꼭지 | KCW-2014-0176 | 부적합 |
8 | 세븐워터 | 수도꼭지 | KCW-2014-0082 | 부적합 |
9 | 에코수전 | 수도꼭지 | KCW-2014-0054 | 부적합 |
기업명 | 제품분류 | 인증번호 | 결과 | |
---|---|---|---|---|
94 | 주식회사 신원아너스 | 수도꼭지 | KCW-2017-0187 | 부적합 |
95 | 조은WS | 수도꼭지 | KCW-2018-0179 | 부적합 |
96 | 트랜드 주식회사 | 수도꼭지 | KCW-2020-0050 | 부적합 |
97 | (주)글로벌에스티 | 수도꼭지 | KCW-2018-0203 | 부적합 |
98 | WENZHOU HAIBA SANITARY CO., LTD. | 수도꼭지 | KCW-2018-0076 | 부적합 |
99 | 아이제이코리아 | 수도꼭지 | KCW-2016-0052 | 부적합 |
100 | 주식회사 혜성코리아 | 수도꼭지 | KCW-2015-0108 | 부적합 |
101 | 주식회사 임창 | 수도꼭지 | KCW-2012-0349 | 부적합 |
102 | SJ코리아 | 수도꼭지 | KCW-2019-0052 | 부적합 |
103 | SJ코리아 | 수도꼭지 | KCW-2012-0226 | 부적합 |
Most frequently occurring
기업명 | 제품분류 | 인증번호 | 결과 | # duplicates | |
---|---|---|---|---|---|
0 | 아이제이코리아 | 수도꼭지 | KCW-2016-0052 | 부적합 | 2 |
1 | 조은WS | 수도꼭지 | KCW-2018-0179 | 부적합 | 2 |