gimi9 Pandas Profiling

Dataset statistics

Number of variables	12
Number of observations	10000
Missing cells	7494
Missing cells (%)	6.2%
Duplicate rows	0
Duplicate rows (%)	0.0%
Total size in memory	1.0 MiB
Average record size in memory	105.0 B

Variable types

Text	9
DateTime	1
Numeric	1
Categorical	1

Dataset

Description	치료재료 급여비급여목록 및 급여상한금액표 / 치료재료마스터 데이터셋은 치료재료 급여 및 비급여 품목별 상한금액, 규격, 단위, 제조사 등의 정보 제공
Author	건강보험심사평가원
URL	https://www.data.go.kr/data/15067463/fileData.do

Alerts

`비고2` is highly imbalanced (54.3%)	Imbalance
`재질` has 105 (1.1%) missing values	Missing
`비고1` has 7354 (73.5%) missing values	Missing
`코드` has unique values	Unique
`상한금액` has 4528 (45.3%) zeros	Zeros

Reproduction

Analysis started	2024-04-20 12:36:52.601956
Analysis finished	2024-04-20 12:36:58.582906
Duration	5.98 seconds
Software version	ydata-profiling vv4.5.1
Download configuration	config.json

구분
Text

Distinct	591
Distinct (%)	5.9%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	22
Median length	20
Mean length	15.2263
Min length	4

Characters and Unicode

Total characters	152263
Distinct characters	44
Distinct categories	5 ?
Distinct scripts	2 ?
Distinct blocks	2 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	585 ?
Unique (%)	5.9%

Sample

1st row	급여 품목(인체조직 포함)
2nd row	(비급여 품목)삭제 및 삭제예정 품목
3rd row	삭제 및 삭제 예정 품목
4th row	100분의 852미만 본인부담 품목
5th row	급여 품목(인체조직 포함)

Value	Count	Frequency (%)
포함	5621	14.8%
품목(인체조직	5621	14.8%
급여	4843	12.7%
품목	4378	11.5%
및	3751	9.9%
급여중지	3682	9.7%
예정	3053	8.0%
삭제	2424	6.4%
비급여	1475	3.9%
품목)삭제	697	1.8%
Other values (590)	2493	6.6%

Most occurring characters

Value	Count	Frequency (%)
	28038	18.4%
품	10696	7.0%
목	10696	7.0%
급	10002	6.6%
여	10002	6.6%
(	6319	4.2%
)	6319	4.2%
인	6204	4.1%
체	5621	3.7%
조	5621	3.7%
Other values (34)	52745	34.6%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	107702	70.7%
Space Separator	28038	18.4%
Open Punctuation	6319	4.2%
Close Punctuation	6319	4.2%
Decimal Number	3885	2.6%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
품	10696	9.9%
목	10696	9.9%
급	10002	9.3%
여	10002	9.3%
인	6204	5.8%
체	5621	5.2%
조	5621	5.2%
직	5621	5.2%
포	5621	5.2%
함	5621	5.2%
Other values (21)	31997	29.7%

Decimal Number

Value	Count	Frequency (%)
0	1330	34.2%
1	993	25.6%
2	346	8.9%
3	188	4.8%
4	186	4.8%
6	180	4.6%
5	178	4.6%
9	173	4.5%
7	157	4.0%
8	154	4.0%

Space Separator

Value	Count	Frequency (%)
	28038	100.0%

Open Punctuation

Value	Count	Frequency (%)
(	6319	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	6319	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	107702	70.7%
Common	44561	29.3%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
품	10696	9.9%
목	10696	9.9%
급	10002	9.3%
여	10002	9.3%
인	6204	5.8%
체	5621	5.2%
조	5621	5.2%
직	5621	5.2%
포	5621	5.2%
함	5621	5.2%
Other values (21)	31997	29.7%

Common

Value	Count	Frequency (%)
	28038	62.9%
(	6319	14.2%
)	6319	14.2%
0	1330	3.0%
1	993	2.2%
2	346	0.8%
3	188	0.4%
4	186	0.4%
6	180	0.4%
5	178	0.4%
Other values (3)	484	1.1%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	107702	70.7%
ASCII	44561	29.3%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	28038	62.9%
(	6319	14.2%
)	6319	14.2%
0	1330	3.0%
1	993	2.2%
2	346	0.8%
3	188	0.4%
4	186	0.4%
6	180	0.4%
5	178	0.4%
Other values (3)	484	1.1%

Hangul

Value	Count	Frequency (%)
품	10696	9.9%
목	10696	9.9%
급	10002	9.3%
여	10002	9.3%
인	6204	5.8%
체	5621	5.2%
조	5621	5.2%
직	5621	5.2%
포	5621	5.2%
함	5621	5.2%
Other values (21)	31997	29.7%

코드
Text

UNIQUE

Distinct	10000
Distinct (%)	100.0%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	9
Median length	8
Mean length	8.0001
Min length	8

Characters and Unicode

Total characters	80001
Distinct characters	36
Distinct categories	2 ?
Distinct scripts	2 ?
Distinct blocks	1 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	10000 ?
Unique (%)	100.0%

Sample

1st row	TFF03095
2nd row	BM5018CU
3rd row	C2100004
4th row	K9203030
5th row	J2401801

Value	Count	Frequency (%)
tff03095	1	< 0.1%
k7222123	1	< 0.1%
k6043014	1	< 0.1%
m3203118	1	< 0.1%
tbe52002	1	< 0.1%
tbl11078	1	< 0.1%
k8311022	1	< 0.1%
j3202003	1	< 0.1%
c3014032	1	< 0.1%
m6710025	1	< 0.1%
Other values (9990)	9990	99.9%

Most occurring characters

Value	Count	Frequency (%)
0	20344	25.4%
1	11049	13.8%
2	7236	9.0%
3	5976	7.5%
4	4632	5.8%
5	3926	4.9%
6	3342	4.2%
7	3208	4.0%
B	2655	3.3%
8	2495	3.1%
Other values (26)	15138	18.9%

Most occurring categories

Value	Count	Frequency (%)
Decimal Number	64270	80.3%
Uppercase Letter	15731	19.7%

Most frequent character per category

Uppercase Letter

Value	Count	Frequency (%)
B	2655	16.9%
K	1997	12.7%
M	1896	12.1%
C	1784	11.3%
J	1238	7.9%
T	964	6.1%
L	796	5.1%
F	700	4.4%
E	615	3.9%
G	389	2.5%
Other values (16)	2697	17.1%

Decimal Number

Value	Count	Frequency (%)
0	20344	31.7%
1	11049	17.2%
2	7236	11.3%
3	5976	9.3%
4	4632	7.2%
5	3926	6.1%
6	3342	5.2%
7	3208	5.0%
8	2495	3.9%
9	2062	3.2%

Most occurring scripts

Value	Count	Frequency (%)
Common	64270	80.3%
Latin	15731	19.7%

Most frequent character per script

Latin

Value	Count	Frequency (%)
B	2655	16.9%
K	1997	12.7%
M	1896	12.1%
C	1784	11.3%
J	1238	7.9%
T	964	6.1%
L	796	5.1%
F	700	4.4%
E	615	3.9%
G	389	2.5%
Other values (16)	2697	17.1%

Common

Value	Count	Frequency (%)
0	20344	31.7%
1	11049	17.2%
2	7236	11.3%
3	5976	9.3%
4	4632	7.2%
5	3926	6.1%
6	3342	5.2%
7	3208	5.0%
8	2495	3.9%
9	2062	3.2%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	80001	100.0%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
0	20344	25.4%
1	11049	13.8%
2	7236	9.0%
3	5976	7.5%
4	4632	5.8%
5	3926	4.9%
6	3342	4.2%
7	3208	4.0%
B	2655	3.3%
8	2495	3.1%
Other values (26)	15138	18.9%

적용일자
Date

Distinct	205
Distinct (%)	2.1%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Minimum	2001-05-01 00:00:00
Maximum	2023-11-01 00:00:00

Histogram

Histogram with fixed size bins (bins=50)

품명
Text

Distinct	7257
Distinct (%)	72.6%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	205
Median length	86
Mean length	18.1032
Min length	2

Characters and Unicode

Total characters	181032
Distinct characters	503
Distinct categories	14 ?
Distinct scripts	4 ?
Distinct blocks	7 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	6103 ?
Unique (%)	61.0%

Sample

1st row	FASCIA
2nd row	ADFLEX BANDAGE
3rd row	TIBIALIS POSTERIOR TENDON
4th row	THE ARTERY COMPRESSION TOURNIQUET (FOR RADIAL ARTERY)
5th row	TRIANGLE TIP KNIFE J

Value	Count	Frequency (%)
plate	596	2.2%
screw	355	1.3%
catheter	329	1.2%
system	309	1.2%
set	223	0.8%
splint	196	0.7%
bone	178	0.7%
cancellous	159	0.6%
plus	156	0.6%
locking	154	0.6%
Other values (7409)	23904	90.0%

Most occurring characters

Value	Count	Frequency (%)
	16768	9.3%
E	16636	9.2%
A	12071	6.7%
T	11317	6.3%
I	10735	5.9%
R	10058	5.6%
S	9837	5.4%
O	9545	5.3%
L	9544	5.3%
N	8714	4.8%
Other values (493)	65807	36.4%

Most occurring categories

Value	Count	Frequency (%)
Uppercase Letter	145325	80.3%
Space Separator	16768	9.3%
Other Letter	12014	6.6%
Decimal Number	1980	1.1%
Dash Punctuation	1648	0.9%
Other Punctuation	1070	0.6%
Close Punctuation	993	0.5%
Open Punctuation	993	0.5%
Letter Number	86	< 0.1%
Lowercase Letter	62	< 0.1%
Other values (4)	93	0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
이	490	4.1%
드	446	3.7%
스	418	3.5%
즈	331	2.8%
거	320	2.7%
에	307	2.6%
대	294	2.4%
메	236	2.0%
디	223	1.9%
붕	222	1.8%
Other values (407)	8727	72.6%

Uppercase Letter

Value	Count	Frequency (%)
E	16636	11.4%
A	12071	8.3%
T	11317	7.8%
I	10735	7.4%
R	10058	6.9%
S	9837	6.8%
O	9545	6.6%
L	9544	6.6%
N	8714	6.0%
C	7691	5.3%
Other values (17)	39177	27.0%

Lowercase Letter

Value	Count	Frequency (%)
α	10	16.1%
m	8	12.9%
e	7	11.3%
r	6	9.7%
o	5	8.1%
i	5	8.1%
β	4	6.5%
n	3	4.8%
u	3	4.8%
h	2	3.2%
Other values (6)	9	14.5%

Decimal Number

Value	Count	Frequency (%)
0	440	22.2%
3	409	20.7%
2	298	15.1%
1	295	14.9%
5	179	9.0%
4	141	7.1%
6	86	4.3%
7	72	3.6%
8	35	1.8%
9	24	1.2%

Other Punctuation

Value	Count	Frequency (%)
,	435	40.7%
.	282	26.4%
/	246	23.0%
&	52	4.9%
:	20	1.9%
"	15	1.4%
'	13	1.2%
·	5	0.5%
%	1	0.1%
*	1	0.1%

Math Symbol

Value	Count	Frequency (%)
+	41	73.2%
~	10	17.9%
∥	2	3.6%
＋	1	1.8%
<	1	1.8%
>	1	1.8%

Letter Number

Value	Count	Frequency (%)
Ⅱ	43	50.0%
Ⅲ	26	30.2%
Ⅰ	13	15.1%
Ⅳ	3	3.5%
Ⅶ	1	1.2%

Other Symbol

Value	Count	Frequency (%)
㎛	15	71.4%
™	4	19.0%
°	2	9.5%

Close Punctuation

Value	Count	Frequency (%)
)	979	98.6%
]	14	1.4%

Open Punctuation

Value	Count	Frequency (%)
(	979	98.6%
[	14	1.4%

Space Separator

Value	Count	Frequency (%)
	16768	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	1648	100.0%

Connector Punctuation

Value	Count	Frequency (%)
_	15	100.0%

Other Number

Value	Count	Frequency (%)
⅓	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Latin	145458	80.3%
Common	23545	13.0%
Hangul	12014	6.6%
Greek	15	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
이	490	4.1%
드	446	3.7%
스	418	3.5%
즈	331	2.8%
거	320	2.7%
에	307	2.6%
대	294	2.4%
메	236	2.0%
디	223	1.9%
붕	222	1.8%
Other values (407)	8727	72.6%

Latin

Value	Count	Frequency (%)
E	16636	11.4%
A	12071	8.3%
T	11317	7.8%
I	10735	7.4%
R	10058	6.9%
S	9837	6.8%
O	9545	6.6%
L	9544	6.6%
N	8714	6.0%
C	7691	5.3%
Other values (35)	39310	27.0%

Common

Value	Count	Frequency (%)
	16768	71.2%
-	1648	7.0%
)	979	4.2%
(	979	4.2%
0	440	1.9%
,	435	1.8%
3	409	1.7%
2	298	1.3%
1	295	1.3%
.	282	1.2%
Other values (28)	1012	4.3%

Greek

Value	Count	Frequency (%)
α	10	66.7%
β	4	26.7%
Ι	1	6.7%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	168886	93.3%
Hangul	12014	6.6%
Number Forms	87	< 0.1%
None	24	< 0.1%
CJK Compat	15	< 0.1%
Letterlike Symbols	4	< 0.1%
Math Operators	2	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	16768	9.9%
E	16636	9.9%
A	12071	7.1%
T	11317	6.7%
I	10735	6.4%
R	10058	6.0%
S	9837	5.8%
O	9545	5.7%
L	9544	5.7%
N	8714	5.2%
Other values (60)	53661	31.8%

Hangul

Value	Count	Frequency (%)
이	490	4.1%
드	446	3.7%
스	418	3.5%
즈	331	2.8%
거	320	2.7%
에	307	2.6%
대	294	2.4%
메	236	2.0%
디	223	1.9%
붕	222	1.8%
Other values (407)	8727	72.6%

Number Forms

Value	Count	Frequency (%)
Ⅱ	43	49.4%
Ⅲ	26	29.9%
Ⅰ	13	14.9%
Ⅳ	3	3.4%
⅓	1	1.1%
Ⅶ	1	1.1%

CJK Compat

Value	Count	Frequency (%)
㎛	15	100.0%

None

Value	Count	Frequency (%)
α	10	41.7%
·	5	20.8%
β	4	16.7%
°	2	8.3%
０	1	4.2%
＋	1	4.2%
Ι	1	4.2%

Letterlike Symbols

Value	Count	Frequency (%)
™	4	100.0%

Math Operators

Value	Count	Frequency (%)
∥	2	100.0%

규격
Text

Distinct	2073
Distinct (%)	20.8%
Missing	21
Missing (%)	0.2%
Memory size	156.2 KiB

Length

Max length	226
Median length	3
Mean length	6.6363363
Min length	1

Characters and Unicode

Total characters	66224
Distinct characters	169
Distinct categories	12 ?
Distinct scripts	4 ?
Distinct blocks	5 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	1463 ?
Unique (%)	14.7%

Sample

1st row	100CM² 이상
2nd row	9.0CMX15.0CM(5.0CMX10.0CM)
3rd row	전규격
4th row	전규격
5th row	전규격

Value	Count	Frequency (%)
전규격	5039	35.5%
x	1075	7.6%
10cm	212	1.5%
type	140	1.0%
215cm	134	0.9%
이하	133	0.9%
straight	123	0.9%
5cm	122	0.9%
needle	120	0.8%
double	118	0.8%
Other values (1846)	6966	49.1%

Most occurring characters

Value	Count	Frequency (%)
전	5054	7.6%
격	5052	7.6%
규	5052	7.6%
M	4925	7.4%
C	4294	6.5%
	4254	6.4%
0	4097	6.2%
1	2871	4.3%
5	2675	4.0%
X	2298	3.5%
Other values (159)	25652	38.7%

Most occurring categories

Value	Count	Frequency (%)
Uppercase Letter	21843	33.0%
Other Letter	18153	27.4%
Decimal Number	15861	24.0%
Space Separator	4254	6.4%
Other Punctuation	2769	4.2%
Other Symbol	758	1.1%
Lowercase Letter	749	1.1%
Close Punctuation	531	0.8%
Open Punctuation	530	0.8%
Dash Punctuation	487	0.7%
Other values (2)	289	0.4%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
전	5054	27.8%
격	5052	27.8%
규	5052	27.8%
이	754	4.2%
상	479	2.6%
만	449	2.5%
미	449	2.5%
하	272	1.5%
초	138	0.8%
과	138	0.8%
Other values (74)	316	1.7%

Uppercase Letter

Value	Count	Frequency (%)
M	4925	22.5%
C	4294	19.7%
X	2298	10.5%
E	1419	6.5%
T	895	4.1%
H	845	3.9%
L	843	3.9%
P	728	3.3%
O	671	3.1%
A	659	3.0%
Other values (17)	4266	19.5%

Lowercase Letter

Value	Count	Frequency (%)
c	240	32.0%
m	163	21.8%
x	137	18.3%
g	49	6.5%
p	35	4.7%
s	31	4.1%
l	24	3.2%
e	21	2.8%
n	12	1.6%
d	8	1.1%
Other values (10)	29	3.9%

Decimal Number

Value	Count	Frequency (%)
0	4097	25.8%
1	2871	18.1%
5	2675	16.9%
2	1924	12.1%
4	1213	7.6%
3	1150	7.3%
7	583	3.7%
6	558	3.5%
8	525	3.3%
9	260	1.6%
Other values (3)	5	< 0.1%

Other Punctuation

Value	Count	Frequency (%)
.	1054	38.1%
"	651	23.5%
,	577	20.8%
/	401	14.5%
*	66	2.4%
:	7	0.3%
#	6	0.2%
&	5	0.2%
″	2	0.1%

Other Symbol

Value	Count	Frequency (%)
㎠	632	83.4%
㎛	58	7.7%
㎤	49	6.5%
㎖	10	1.3%
㎟	7	0.9%
㎝	2	0.3%

Math Symbol

Value	Count	Frequency (%)
×	166	63.1%
~	54	20.5%
+	41	15.6%
=	1	0.4%
～	1	0.4%

Space Separator

Value	Count	Frequency (%)
	4254	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	531	100.0%

Open Punctuation

Value	Count	Frequency (%)
(	530	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	487	100.0%

Other Number

Value	Count	Frequency (%)
²	26	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Common	25479	38.5%
Latin	22583	34.1%
Hangul	18153	27.4%
Greek	9	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
전	5054	27.8%
격	5052	27.8%
규	5052	27.8%
이	754	4.2%
상	479	2.6%
만	449	2.5%
미	449	2.5%
하	272	1.5%
초	138	0.8%
과	138	0.8%
Other values (74)	316	1.7%

Latin

Value	Count	Frequency (%)
M	4925	21.8%
C	4294	19.0%
X	2298	10.2%
E	1419	6.3%
T	895	4.0%
H	845	3.7%
L	843	3.7%
P	728	3.2%
O	671	3.0%
A	659	2.9%
Other values (35)	5006	22.2%

Common

Value	Count	Frequency (%)
	4254	16.7%
0	4097	16.1%
1	2871	11.3%
5	2675	10.5%
2	1924	7.6%
4	1213	4.8%
3	1150	4.5%
.	1054	4.1%
"	651	2.6%
㎠	632	2.5%
Other values (28)	4958	19.5%

Greek

Value	Count	Frequency (%)
Φ	6	66.7%
μ	3	33.3%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	47104	71.1%
Hangul	18153	27.4%
CJK Compat	758	1.1%
None	207	0.3%
Punctuation	2	< 0.1%

Most frequent character per block

Hangul

Value	Count	Frequency (%)
전	5054	27.8%
격	5052	27.8%
규	5052	27.8%
이	754	4.2%
상	479	2.6%
만	449	2.5%
미	449	2.5%
하	272	1.5%
초	138	0.8%
과	138	0.8%
Other values (74)	316	1.7%

ASCII

Value	Count	Frequency (%)
M	4925	10.5%
C	4294	9.1%
	4254	9.0%
0	4097	8.7%
1	2871	6.1%
5	2675	5.7%
X	2298	4.9%
2	1924	4.1%
E	1419	3.0%
4	1213	2.6%
Other values (60)	17134	36.4%

CJK Compat

Value	Count	Frequency (%)
㎠	632	83.4%
㎛	58	7.7%
㎤	49	6.5%
㎖	10	1.3%
㎟	7	0.9%
㎝	2	0.3%

None

Value	Count	Frequency (%)
×	166	80.2%
²	26	12.6%
Φ	6	2.9%
μ	3	1.4%
５	2	1.0%
９	2	1.0%
～	1	0.5%
８	1	0.5%

Punctuation

Value	Count	Frequency (%)
″	2	100.0%

단위
Text

Distinct	66
Distinct (%)	0.7%
Missing	4
Missing (%)	< 0.1%
Memory size	156.2 KiB

Length

Max length	16
Median length	3
Mean length	2.9867947
Min length	1

Characters and Unicode

Total characters	29856
Distinct characters	52
Distinct categories	9 ?
Distinct scripts	3 ?
Distinct blocks	2 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	34 ?
Unique (%)	0.3%

Sample

1st row	1EA
2nd row	1EA
3rd row	1EA
4th row	1EA
5th row	1EA

Value	Count	Frequency (%)
1ea	8934	89.2%
1장	339	3.4%
1set	149	1.5%
1roll	118	1.2%
편측	111	1.1%
1회	80	0.8%
1매	62	0.6%
	45	0.4%
1kit	30	0.3%
cm2	22	0.2%
Other values (51)	121	1.2%

Most occurring characters

Value	Count	Frequency (%)
1	9769	32.7%
E	9113	30.5%
A	8961	30.0%
장	339	1.1%
L	244	0.8%
T	199	0.7%
S	166	0.6%
R	124	0.4%
O	122	0.4%
편	111	0.4%
Other values (42)	708	2.4%

Most occurring categories

Value	Count	Frequency (%)
Uppercase Letter	19106	64.0%
Decimal Number	9888	33.1%
Other Letter	778	2.6%
Dash Punctuation	45	0.2%
Space Separator	20	0.1%
Other Punctuation	11	< 0.1%
Open Punctuation	3	< 0.1%
Close Punctuation	3	< 0.1%
Lowercase Letter	2	< 0.1%

Most frequent character per category

Uppercase Letter

Value	Count	Frequency (%)
E	9113	47.7%
A	8961	46.9%
L	244	1.3%
T	199	1.0%
S	166	0.9%
R	124	0.6%
O	122	0.6%
I	52	0.3%
K	38	0.2%
C	27	0.1%
Other values (10)	60	0.3%

Other Letter

Value	Count	Frequency (%)
장	339	43.6%
편	111	14.3%
측	111	14.3%
회	98	12.6%
매	62	8.0%
근	13	1.7%
병	9	1.2%
면	8	1.0%
개	6	0.8%
캅	6	0.8%
Other values (4)	15	1.9%

Decimal Number

Value	Count	Frequency (%)
1	9769	98.8%
2	47	0.5%
0	27	0.3%
7	11	0.1%
5	11	0.1%
3	8	0.1%
4	7	0.1%
9	4	< 0.1%
6	3	< 0.1%
8	1	< 0.1%

Other Punctuation

Value	Count	Frequency (%)
/	7	63.6%
,	4	36.4%

Lowercase Letter

Value	Count	Frequency (%)
e	1	50.0%
t	1	50.0%

Dash Punctuation

Value	Count	Frequency (%)
-	45	100.0%

Space Separator

Value	Count	Frequency (%)
	20	100.0%

Open Punctuation

Value	Count	Frequency (%)
(	3	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	3	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Latin	19108	64.0%
Common	9970	33.4%
Hangul	778	2.6%

Most frequent character per script

Latin

Value	Count	Frequency (%)
E	9113	47.7%
A	8961	46.9%
L	244	1.3%
T	199	1.0%
S	166	0.9%
R	124	0.6%
O	122	0.6%
I	52	0.3%
K	38	0.2%
C	27	0.1%
Other values (12)	62	0.3%

Common

Value	Count	Frequency (%)
1	9769	98.0%
2	47	0.5%
-	45	0.5%
0	27	0.3%
	20	0.2%
7	11	0.1%
5	11	0.1%
3	8	0.1%
/	7	0.1%
4	7	0.1%
Other values (6)	18	0.2%

Hangul

Value	Count	Frequency (%)
장	339	43.6%
편	111	14.3%
측	111	14.3%
회	98	12.6%
매	62	8.0%
근	13	1.7%
병	9	1.2%
면	8	1.0%
개	6	0.8%
캅	6	0.8%
Other values (4)	15	1.9%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	29078	97.4%
Hangul	778	2.6%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
1	9769	33.6%
E	9113	31.3%
A	8961	30.8%
L	244	0.8%
T	199	0.7%
S	166	0.6%
R	124	0.4%
O	122	0.4%
I	52	0.2%
2	47	0.2%
Other values (28)	281	1.0%

Hangul

Value	Count	Frequency (%)
장	339	43.6%
편	111	14.3%
측	111	14.3%
회	98	12.6%
매	62	8.0%
근	13	1.7%
병	9	1.2%
면	8	1.0%
개	6	0.8%
캅	6	0.8%
Other values (4)	15	1.9%

상한금액
Real number (ℝ)

ZEROS

Distinct	1499
Distinct (%)	15.0%
Missing	2
Missing (%)	< 0.1%
Infinite	0
Infinite (%)	0.0%
Mean	193143.18

Minimum	0
Maximum	22230140
Zeros	4528
Zeros (%)	45.3%
Negative	0
Negative (%)	0.0%
Memory size	166.0 KiB

Quantile statistics

Minimum	0
5-th percentile	0
Q1	0
median	648
Q3	75450
95-th percentile	867140
Maximum	22230140
Range	22230140
Interquartile range (IQR)	75450

Descriptive statistics

Standard deviation	966606.31
Coefficient of variation (CV)	5.00461
Kurtosis	285.91707
Mean	193143.18
Median Absolute Deviation (MAD)	648
Skewness	15.159057
Sum	1.9310456 × 10⁹
Variance	9.3432777 × 10¹¹
Monotonicity	Not monotonic

Histogram with fixed size bins (bins=50)

Value	Count	Frequency (%)
0	4528	45.3%
27580	69	0.7%
1470	64	0.6%
1235780	53	0.5%
44560	47	0.5%
81300	44	0.4%
5170	38	0.4%
4400	37	0.4%
98970	36	0.4%
307	33	0.3%
Other values (1489)	5049	50.5%

Minimum 10 values
Maximum 10 values

Value	Count	Frequency (%)
0	4528	45.3%
9	16	0.2%
14	8	0.1%
18	3	< 0.1%
20	15	0.1%
21	7	0.1%
23	2	< 0.1%
28	5	0.1%
29	4	< 0.1%
30	8	0.1%

Value	Count	Frequency (%)
22230140	4	< 0.1%
20971820	3	< 0.1%
20209220	1	< 0.1%
19868040	2	< 0.1%
19009430	1	< 0.1%
17286320	1	< 0.1%
15682230	1	< 0.1%
13265100	1	< 0.1%
13031300	1	< 0.1%
12347370	4	< 0.1%

제조회사
Text

Distinct	2758
Distinct (%)	27.6%
Missing	2
Missing (%)	< 0.1%
Memory size	156.2 KiB

Length

Max length	141
Median length	59
Mean length	17.224245
Min length	1

Characters and Unicode

Total characters	172208
Distinct characters	202
Distinct categories	11 ?
Distinct scripts	3 ?
Distinct blocks	3 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	1428 ?
Unique (%)	14.3%

Sample

1st row	COMMUNITY BLOOD CENTER/COMMUNITY TISSUE SERVICES
2nd row	YOUNG CHEMICAL
3rd row	REGENERATION TECHNOLOGY INC
4th row	HANGZHOU SHANYOU MEDICAL EQUIPMENT CO. LTD
5th row	OLYMPUS MEDICAL SYSTEMS CORPORATION

Value	Count	Frequency (%)
medical	1614	6.7%
ltd	904	3.7%
co	773	3.2%
inc	743	3.1%
co.,ltd	560	2.3%
gmbh	494	2.0%
corporation	333	1.4%
	227	0.9%
tissue	211	0.9%
surgical	202	0.8%
Other values (2683)	18178	75.0%

Most occurring characters

Value	Count	Frequency (%)
	14425	8.4%
E	14209	8.3%
I	12961	7.5%
O	11920	6.9%
C	10973	6.4%
N	10713	6.2%
A	10445	6.1%
T	9075	5.3%
L	8317	4.8%
S	7988	4.6%
Other values (192)	61182	35.5%

Most occurring categories

Value	Count	Frequency (%)
Uppercase Letter	146407	85.0%
Space Separator	14425	8.4%
Other Punctuation	6605	3.8%
Other Letter	3777	2.2%
Dash Punctuation	366	0.2%
Close Punctuation	197	0.1%
Open Punctuation	196	0.1%
Lowercase Letter	144	0.1%
Decimal Number	77	< 0.1%
Other Symbol	8	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
조	181	4.8%
직	177	4.7%
행	177	4.7%
은	177	4.7%
공	174	4.6%
이	151	4.0%
오	132	3.5%
바	132	3.5%
대	130	3.4%
원	128	3.4%
Other values (126)	2218	58.7%

Uppercase Letter

Value	Count	Frequency (%)
E	14209	9.7%
I	12961	8.9%
O	11920	8.1%
C	10973	7.5%
N	10713	7.3%
A	10445	7.1%
T	9075	6.2%
L	8317	5.7%
S	7988	5.5%
D	7863	5.4%
Other values (16)	41943	28.6%

Lowercase Letter

Value	Count	Frequency (%)
o	24	16.7%
n	14	9.7%
r	13	9.0%
a	12	8.3%
c	12	8.3%
i	12	8.3%
e	11	7.6%
d	10	6.9%
t	9	6.2%
u	6	4.2%
Other values (6)	21	14.6%

Other Punctuation

Value	Count	Frequency (%)
.	3794	57.4%
,	2023	30.6%
&	574	8.7%
/	196	3.0%
＆	9	0.1%
'	6	0.1%
:	1	< 0.1%
，	1	< 0.1%
·	1	< 0.1%

Decimal Number

Value	Count	Frequency (%)
3	53	68.8%
0	8	10.4%
1	6	7.8%
2	3	3.9%
6	3	3.9%
5	1	1.3%
9	1	1.3%
8	1	1.3%
7	1	1.3%

Space Separator

Value	Count	Frequency (%)
	14425	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	366	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	197	100.0%

Open Punctuation

Value	Count	Frequency (%)
(	196	100.0%

Other Symbol

Value	Count	Frequency (%)
㈜	8	100.0%

Math Symbol

Value	Count	Frequency (%)
+	6	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Latin	146551	85.1%
Common	21872	12.7%
Hangul	3785	2.2%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
조	181	4.8%
직	177	4.7%
행	177	4.7%
은	177	4.7%
공	174	4.6%
이	151	4.0%
오	132	3.5%
바	132	3.5%
대	130	3.4%
원	128	3.4%
Other values (127)	2226	58.8%

Latin

Value	Count	Frequency (%)
E	14209	9.7%
I	12961	8.8%
O	11920	8.1%
C	10973	7.5%
N	10713	7.3%
A	10445	7.1%
T	9075	6.2%
L	8317	5.7%
S	7988	5.5%
D	7863	5.4%
Other values (32)	42087	28.7%

Common

Value	Count	Frequency (%)
	14425	66.0%
.	3794	17.3%
,	2023	9.2%
&	574	2.6%
-	366	1.7%
)	197	0.9%
/	196	0.9%
(	196	0.9%
3	53	0.2%
＆	9	< 0.1%
Other values (13)	39	0.2%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	168412	97.8%
Hangul	3777	2.2%
None	19	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	14425	8.6%
E	14209	8.4%
I	12961	7.7%
O	11920	7.1%
C	10973	6.5%
N	10713	6.4%
A	10445	6.2%
T	9075	5.4%
L	8317	4.9%
S	7988	4.7%
Other values (52)	57386	34.1%

Hangul

Value	Count	Frequency (%)
조	181	4.8%
직	177	4.7%
행	177	4.7%
은	177	4.7%
공	174	4.6%
이	151	4.0%
오	132	3.5%
바	132	3.5%
대	130	3.4%
원	128	3.4%
Other values (126)	2218	58.7%

None

Value	Count	Frequency (%)
＆	9	47.4%
㈜	8	42.1%
，	1	5.3%
·	1	5.3%

재질
Text

MISSING

Distinct	3118
Distinct (%)	31.5%
Missing	105
Missing (%)	1.1%
Memory size	156.2 KiB

Length

Max length	156
Median length	84
Mean length	15.4762
Min length	1

Characters and Unicode

Total characters	153137
Distinct characters	424
Distinct categories	14 ?
Distinct scripts	4 ?
Distinct blocks	4 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	2063 ?
Unique (%)	20.8%

Sample

1st row	FASCIA LATA
2nd row	폴리우레탄필름/폴리아크릴알킬에스텔에멀전/부직포/폴리에칠렌망
3rd row	HUMAN
4th row	PC100%, SILICONE 100%
5th row	STAINLESS STEEL 304 등

Value	Count	Frequency (%)
등	2003	9.7%
titanium	1280	6.2%
stainless	743	3.6%
steel	707	3.4%
	579	2.8%
alloy	546	2.6%
cotton	464	2.2%
polyurethane	309	1.5%
bone	293	1.4%
면사	252	1.2%
Other values (2606)	13569	65.4%

Most occurring characters

Value	Count	Frequency (%)
	11115	7.3%
E	10991	7.2%
L	10483	6.8%
T	10015	6.5%
I	8694	5.7%
A	8685	5.7%
O	8297	5.4%
N	7322	4.8%
S	5536	3.6%
P	4933	3.2%
Other values (414)	67066	43.8%

Most occurring categories

Value	Count	Frequency (%)
Uppercase Letter	104460	68.2%
Other Letter	26461	17.3%
Space Separator	11115	7.3%
Other Punctuation	4014	2.6%
Decimal Number	2450	1.6%
Dash Punctuation	1748	1.1%
Math Symbol	1394	0.9%
Close Punctuation	558	0.4%
Open Punctuation	551	0.4%
Lowercase Letter	367	0.2%
Other values (4)	19	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
등	2243	8.5%
리	1964	7.4%
폴	1597	6.0%
레	1069	4.0%
탄	926	3.5%
우	914	3.5%
이	618	2.3%
로	614	2.3%
부	611	2.3%
스	611	2.3%
Other values (328)	15294	57.8%

Uppercase Letter

Value	Count	Frequency (%)
E	10991	10.5%
L	10483	10.0%
T	10015	9.6%
I	8694	8.3%
A	8685	8.3%
O	8297	7.9%
N	7322	7.0%
S	5536	5.3%
P	4933	4.7%
C	4705	4.5%
Other values (18)	24799	23.7%

Lowercase Letter

Value	Count	Frequency (%)
β	126	34.3%
e	46	12.5%
l	22	6.0%
t	20	5.4%
a	19	5.2%
i	16	4.4%
o	16	4.4%
n	14	3.8%
y	13	3.5%
c	13	3.5%
Other values (14)	62	16.9%

Decimal Number

Value	Count	Frequency (%)
4	537	21.9%
6	532	21.7%
0	492	20.1%
1	250	10.2%
2	189	7.7%
5	135	5.5%
3	116	4.7%
7	75	3.1%
8	70	2.9%
9	54	2.2%

Other Punctuation

Value	Count	Frequency (%)
,	2932	73.0%
%	426	10.6%
.	251	6.3%
/	243	6.1%
:	104	2.6%
&	50	1.2%
;	7	0.2%
'	1	< 0.1%

Math Symbol

Value	Count	Frequency (%)
+	1363	97.8%
~	12	0.9%
＋	11	0.8%
±	8	0.6%

Other Number

Value	Count	Frequency (%)
₂	2	40.0%
₃	2	40.0%
₄	1	20.0%

Close Punctuation

Value	Count	Frequency (%)
)	554	99.3%
]	4	0.7%

Open Punctuation

Value	Count	Frequency (%)
(	550	99.8%
[	1	0.2%

Space Separator

Value	Count	Frequency (%)
	11115	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	1748	100.0%

Letter Number

Value	Count	Frequency (%)
Ⅰ	9	100.0%

Format

Value	Count	Frequency (%)
	3	100.0%

Connector Punctuation

Value	Count	Frequency (%)
_	2	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Latin	104695	68.4%
Hangul	26461	17.3%
Common	21840	14.3%
Greek	141	0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
등	2243	8.5%
리	1964	7.4%
폴	1597	6.0%
레	1069	4.0%
탄	926	3.5%
우	914	3.5%
이	618	2.3%
로	614	2.3%
부	611	2.3%
스	611	2.3%
Other values (328)	15294	57.8%

Latin

Value	Count	Frequency (%)
E	10991	10.5%
L	10483	10.0%
T	10015	9.6%
I	8694	8.3%
A	8685	8.3%
O	8297	7.9%
N	7322	7.0%
S	5536	5.3%
P	4933	4.7%
C	4705	4.5%
Other values (37)	25034	23.9%

Common

Value	Count	Frequency (%)
	11115	50.9%
,	2932	13.4%
-	1748	8.0%
+	1363	6.2%
)	554	2.5%
(	550	2.5%
4	537	2.5%
6	532	2.4%
0	492	2.3%
%	426	2.0%
Other values (23)	1591	7.3%

Greek

Value	Count	Frequency (%)
β	126	89.4%
Β	9	6.4%
α	3	2.1%
σ	1	0.7%
Ι	1	0.7%
ω	1	0.7%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	126492	82.6%
Hangul	26461	17.3%
None	175	0.1%
Number Forms	9	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	11115	8.8%
E	10991	8.7%
L	10483	8.3%
T	10015	7.9%
I	8694	6.9%
A	8685	6.9%
O	8297	6.6%
N	7322	5.8%
S	5536	4.4%
P	4933	3.9%
Other values (62)	40421	32.0%

Hangul

Value	Count	Frequency (%)
등	2243	8.5%
리	1964	7.4%
폴	1597	6.0%
레	1069	4.0%
탄	926	3.5%
우	914	3.5%
이	618	2.3%
로	614	2.3%
부	611	2.3%
스	611	2.3%
Other values (328)	15294	57.8%

None

Value	Count	Frequency (%)
β	126	72.0%
＋	11	6.3%
Β	9	5.1%
±	8	4.6%
ß	7	4.0%
	3	1.7%
α	3	1.7%
₂	2	1.1%
₃	2	1.1%
σ	1	0.6%
Other values (3)	3	1.7%

Number Forms

Value	Count	Frequency (%)
Ⅰ	9	100.0%

수입업소
Text

Distinct	1787
Distinct (%)	17.9%
Missing	6
Missing (%)	0.1%
Memory size	156.2 KiB

Length

Max length	22
Median length	19
Mean length	7.0257154
Min length	1

Characters and Unicode

Total characters	70215
Distinct characters	459
Distinct categories	9 ?
Distinct scripts	3 ?
Distinct blocks	3 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	709 ?
Unique (%)	7.1%

Sample

1st row	주식회사 제이비엠그룹
2nd row	영케미칼
3rd row	코리아본뱅크
4th row	오메드
5th row	올림푸스한국㈜

Value	Count	Frequency (%)
한국존슨앤드존슨메디칼	372	3.5%
주식회사	292	2.8%
메드트로닉코리아	228	2.2%
한국스트라이커	215	2.0%
짐머바이오메트코리아	182	1.7%
비브라운코리아	135	1.3%
스미스앤드네퓨	112	1.1%
원바이오젠	111	1.1%
보스톤사이언티픽코리아	96	0.9%
시지바이오	92	0.9%
Other values (1774)	8678	82.5%

Most occurring characters

Value	Count	Frequency (%)
메	4066	5.8%
디	3153	4.5%
이	3010	4.3%
스	2775	4.0%
아	2460	3.5%
코	2252	3.2%
리	2181	3.1%
칼	2181	3.1%
주	2040	2.9%
)	1841	2.6%
Other values (449)	44256	63.0%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	65366	93.1%
Close Punctuation	1841	2.6%
Open Punctuation	1840	2.6%
Space Separator	577	0.8%
Other Symbol	434	0.6%
Uppercase Letter	144	0.2%
Dash Punctuation	8	< 0.1%
Other Punctuation	4	< 0.1%
Decimal Number	1	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
메	4066	6.2%
디	3153	4.8%
이	3010	4.6%
스	2775	4.2%
아	2460	3.8%
코	2252	3.4%
리	2181	3.3%
칼	2181	3.3%
주	2040	3.1%
드	1522	2.3%
Other values (425)	39726	60.8%

Uppercase Letter

Value	Count	Frequency (%)
K	28	19.4%
B	19	13.2%
E	18	12.5%
H	10	6.9%
A	10	6.9%
M	9	6.2%
I	9	6.2%
S	9	6.2%
C	7	4.9%
L	5	3.5%
Other values (7)	20	13.9%

Close Punctuation

Value	Count	Frequency (%)
)	1841	100.0%

Open Punctuation

Value	Count	Frequency (%)
(	1840	100.0%

Space Separator

Value	Count	Frequency (%)
	577	100.0%

Other Symbol

Value	Count	Frequency (%)
㈜	434	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	8	100.0%

Other Punctuation

Value	Count	Frequency (%)
.	4	100.0%

Decimal Number

Value	Count	Frequency (%)
2	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	65800	93.7%
Common	4271	6.1%
Latin	144	0.2%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
메	4066	6.2%
디	3153	4.8%
이	3010	4.6%
스	2775	4.2%
아	2460	3.7%
코	2252	3.4%
리	2181	3.3%
칼	2181	3.3%
주	2040	3.1%
드	1522	2.3%
Other values (426)	40160	61.0%

Latin

Value	Count	Frequency (%)
K	28	19.4%
B	19	13.2%
E	18	12.5%
H	10	6.9%
A	10	6.9%
M	9	6.2%
I	9	6.2%
S	9	6.2%
C	7	4.9%
L	5	3.5%
Other values (7)	20	13.9%

Common

Value	Count	Frequency (%)
)	1841	43.1%
(	1840	43.1%
	577	13.5%
-	8	0.2%
.	4	0.1%
2	1	< 0.1%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	65366	93.1%
ASCII	4415	6.3%
None	434	0.6%

Most frequent character per block

Hangul

Value	Count	Frequency (%)
메	4066	6.2%
디	3153	4.8%
이	3010	4.6%
스	2775	4.2%
아	2460	3.8%
코	2252	3.4%
리	2181	3.3%
칼	2181	3.3%
주	2040	3.1%
드	1522	2.3%
Other values (425)	39726	60.8%

ASCII

Value	Count	Frequency (%)
)	1841	41.7%
(	1840	41.7%
	577	13.1%
K	28	0.6%
B	19	0.4%
E	18	0.4%
H	10	0.2%
A	10	0.2%
M	9	0.2%
I	9	0.2%
Other values (13)	54	1.2%

None

Value	Count	Frequency (%)
㈜	434	100.0%

비고1
Text

MISSING

Distinct	123
Distinct (%)	4.6%
Missing	7354
Missing (%)	73.5%
Memory size	156.2 KiB

Length

Max length	149
Median length	131
Mean length	43.805745
Min length	9

Characters and Unicode

Total characters	115910
Distinct characters	139
Distinct categories	9 ?
Distinct scripts	3 ?
Distinct blocks	3 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	59 ?
Unique (%)	2.2%

Sample

1st row	본인부담률 80% / 고시 제2022-175호(2022.8.1.적용) 관련 본인부담률 90%
2nd row	고시 제2019-80호(2019.5.1.적용) 관련 선별급여 본인부담률 80% 적용/ 내시경적 점막하 박리절제술 (ENDOSCOPIC SUBMUCOSAL DISSECTION,ESD)용 KNIFE→내시경적 시술용 KNIFE 중분류명 변경
3rd row	고시 제2018-281호(2019.1.1.적용) 관련 선별급여 본인부담률 80% 적용
4th row	고시 제2019-80호(2019.5.1.적용) 관련 선별급여 본인부담률 80% 적용
5th row	본인부담률 80%

Value	Count	Frequency (%)
본인부담률	2663	15.5%
80	2366	13.7%
관련	2094	12.2%
고시	2092	12.1%
적용	2062	12.0%
선별급여	2055	11.9%
제2019-80호(2019.5.1.적용	1126	6.5%
	527	3.1%
제2018-281호(2019.1.1.적용	434	2.5%
제2021-48호(2021.7.1.적용	329	1.9%
Other values (152)	1481	8.6%

Most occurring characters

Value	Count	Frequency (%)
	14597	12.6%
0	9401	8.1%
1	8115	7.0%
2	7557	6.5%
.	7421	6.4%
8	5158	4.5%
용	4553	3.9%
적	4547	3.9%
9	3187	2.7%
%	2824	2.4%
Other values (129)	48550	41.9%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	45163	39.0%
Decimal Number	36586	31.6%
Space Separator	14597	12.6%
Other Punctuation	10911	9.4%
Open Punctuation	2548	2.2%
Close Punctuation	2548	2.2%
Dash Punctuation	2479	2.1%
Uppercase Letter	984	0.8%
Math Symbol	94	0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
용	4553	10.1%
적	4547	10.1%
인	2685	5.9%
부	2685	5.9%
담	2664	5.9%
률	2663	5.9%
본	2663	5.9%
제	2483	5.5%
호	2473	5.5%
여	2201	4.9%
Other values (81)	15546	34.4%

Uppercase Letter

Value	Count	Frequency (%)
S	103	10.5%
B	90	9.1%
E	90	9.1%
I	82	8.3%
O	72	7.3%
N	68	6.9%
C	66	6.7%
M	61	6.2%
D	52	5.3%
K	49	5.0%
Other values (16)	251	25.5%

Decimal Number

Value	Count	Frequency (%)
0	9401	25.7%
1	8115	22.2%
2	7557	20.7%
8	5158	14.1%
9	3187	8.7%
5	1886	5.2%
7	570	1.6%
4	507	1.4%
3	132	0.4%
6	73	0.2%

Other Punctuation

Value	Count	Frequency (%)
.	7421	68.0%
%	2824	25.9%
/	538	4.9%
,	126	1.2%
&	2	< 0.1%

Math Symbol

Value	Count	Frequency (%)
→	79	84.0%
~	14	14.9%
+	1	1.1%

Space Separator

Value	Count	Frequency (%)
	14597	100.0%

Open Punctuation

Value	Count	Frequency (%)
(	2548	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	2548	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	2479	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Common	69763	60.2%
Hangul	45163	39.0%
Latin	984	0.8%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
용	4553	10.1%
적	4547	10.1%
인	2685	5.9%
부	2685	5.9%
담	2664	5.9%
률	2663	5.9%
본	2663	5.9%
제	2483	5.5%
호	2473	5.5%
여	2201	4.9%
Other values (81)	15546	34.4%

Latin

Value	Count	Frequency (%)
S	103	10.5%
B	90	9.1%
E	90	9.1%
I	82	8.3%
O	72	7.3%
N	68	6.9%
C	66	6.7%
M	61	6.2%
D	52	5.3%
K	49	5.0%
Other values (16)	251	25.5%

Common

Value	Count	Frequency (%)
	14597	20.9%
0	9401	13.5%
1	8115	11.6%
2	7557	10.8%
.	7421	10.6%
8	5158	7.4%
9	3187	4.6%
%	2824	4.0%
(	2548	3.7%
)	2548	3.7%
Other values (12)	6407	9.2%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	70668	61.0%
Hangul	45163	39.0%
Arrows	79	0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	14597	20.7%
0	9401	13.3%
1	8115	11.5%
2	7557	10.7%
.	7421	10.5%
8	5158	7.3%
9	3187	4.5%
%	2824	4.0%
(	2548	3.6%
)	2548	3.6%
Other values (37)	7312	10.3%

Hangul

Value	Count	Frequency (%)
용	4553	10.1%
적	4547	10.1%
인	2685	5.9%
부	2685	5.9%
담	2664	5.9%
률	2663	5.9%
본	2663	5.9%
제	2483	5.5%
호	2473	5.5%
여	2201	4.9%
Other values (81)	15546	34.4%

Arrows

Value	Count	Frequency (%)
→	79	100.0%

비고2
Categorical

IMBALANCE

Distinct	3
Distinct (%)	< 0.1%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

<NA>	7992
중복인정여부 Y	2007
중복인정여부 Y	1

Length

Max length	9
Median length	4
Mean length	4.8033
Min length	4

Unique

Unique	1 ?
Unique (%)	< 0.1%

Sample

1st row	<NA>
2nd row	<NA>
3rd row	<NA>
4th row	<NA>
5th row	중복인정여부 Y

Common Values

Value	Count	Frequency (%)
<NA>	7992	79.9%
중복인정여부 Y	2007	20.1%
중복인정여부 Y	1	< 0.1%

Length

Histogram of lengths of the category

Common Values (Plot)

Value	Count	Frequency (%)
na	7992	66.6%
중복인정여부	2008	16.7%
y	2008	16.7%

상한금액

상한금액

Phik (φk)
Auto

Heatmap
Table

	단위	상한금액	비고2
단위	1.000	0.000	0.000
상한금액	0.000	1.000	0.000
비고2	0.000	0.000	1.000

Heatmap
Table

	상한금액	비고2
상한금액	1.000	0.000
비고2	0.000	1.000

A simple visualization of nullity by column.

Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

First rows
Last rows

	구분	코드	적용일자	품명	규격	단위	상한금액	제조회사	재질	수입업소	비고1	비고2
20335	급여 품목(인체조직 포함)	TFF03095	2023-04-01	FASCIA	100CM² 이상	1EA	499200	COMMUNITY BLOOD CENTER/COMMUNITY TISSUE SERVICES	FASCIA LATA	주식회사 제이비엠그룹	<NA>	<NA>
43582	(비급여 품목)삭제 및 삭제예정 품목	BM5018CU	2021-07-01	ADFLEX BANDAGE	9.0CMX15.0CM(5.0CMX10.0CM)	1EA	0	YOUNG CHEMICAL	폴리우레탄필름/폴리아크릴알킬에스텔에멀전/부직포/폴리에칠렌망	영케미칼	<NA>	<NA>
32127	삭제 및 삭제 예정 품목	C2100004	2006-08-01	TIBIALIS POSTERIOR TENDON	전규격	1EA	0	REGENERATION TECHNOLOGY INC	HUMAN	코리아본뱅크	<NA>	<NA>
21763	100분의 852미만 본인부담 품목	K9203030	2023-04-01	THE ARTERY COMPRESSION TOURNIQUET (FOR RADIAL ARTERY)	전규격	1EA	13910	HANGZHOU SHANYOU MEDICAL EQUIPMENT CO. LTD	PC100%, SILICONE 100%	오메드	본인부담률 80% / 고시 제2022-175호(2022.8.1.적용) 관련 본인부담률 90%	<NA>
7976	급여 품목(인체조직 포함)	J2401801	2023-04-01	TRIANGLE TIP KNIFE J	전규격	1EA	215680	OLYMPUS MEDICAL SYSTEMS CORPORATION	STAINLESS STEEL 304 등	올림푸스한국㈜	고시 제2019-80호(2019.5.1.적용) 관련 선별급여 본인부담률 80% 적용/ 내시경적 점막하 박리절제술 (ENDOSCOPIC SUBMUCOSAL DISSECTION,ESD)용 KNIFE→내시경적 시술용 KNIFE 중분류명 변경	중복인정여부 Y
4965	급여 품목(인체조직 포함)	E2002104	2023-04-01	NEXGEN LCCK FEMORAL COMPONENT	전규격	1EA	1875640	ZIMMER	CO.CR.MO.ALLOY	짐머바이오메트코리아	<NA>	<NA>
27132	급여중지 및 급여중지 예정 품목	G8201404	2022-01-01	ENTICOS S	전규격	1EA	0	BIOTRONIK SE&CO.KG	TITANIUM 등	바이오트로닉코리아㈜	<NA>	<NA>
40622	비급여 품목(인체조직 포함)	BM5119HF	2022-07-01	가드픽스	전규격	1EA	0	EVERAID	폴리우레탄필름, 부직포 등	에버레이드(주)	<NA>	<NA>
19780	급여 품목(인체조직 포함)	TBE62201	2023-04-01	DISTAL FEMUR HEMI, MEDIAL	W/O CARTILAGE	1EA	1507020	셀루메드	FEMUR	셀루메드	고시 제2018-281호(2019.1.1.적용) 관련 선별급여 본인부담률 80% 적용	중복인정여부 Y
10940	급여 품목(인체조직 포함)	K5011204	2023-04-01	SILICONE FOLEY CATHTER(T)	3WAY	1EA	4700	SE-WOON	SILICONE	세운메디칼	고시 제2019-80호(2019.5.1.적용) 관련 선별급여 본인부담률 80% 적용	중복인정여부 Y

	구분	코드	적용일자	품명	규격	단위	상한금액	제조회사	재질	수입업소	비고1	비고2
4512	급여 품목(인체조직 포함)	D1213519	2023-04-01	TREU DISPOSABLE CANNULA	전규격	1EA	43710	SMG INC.	폴리카보네이트+니티놀+스테인레스스틸	(주)에스엠지	<NA>	<NA>
16844	급여 품목(인체조직 포함)	M2134008	2023-04-01	G-PLATE	전규격	1EA	2020	HUREV	알루미늄박, 겔 등	(주)휴레브	<NA>	<NA>
36907	삭제 및 삭제 예정 품목	TTA02005	2014-05-01	ACHILLES TENDON W/BONE HEMI	HEMI	1EA	0	COMMUNITY TISSUE SERVICES	ACHILLES TENDON W/BONE	셀루메드	<NA>	<NA>
12090	급여 품목(인체조직 포함)	K7201039	2023-04-01	탄력붕대	15CM X 215CM	1EA	650	SHAOXING HOSMED MEDICAL PRODUCTS CO.LTD	COTTON	하우스메디칼	고시 제2019-80호(2019.5.1.적용) 관련 선별급여 본인부담률 80% 적용	중복인정여부 Y
5481	급여 품목(인체조직 포함)	F0001042	2023-04-01	4CIS ACP SYSTEM	전규격	1EA	441930	SOLCO BIOMEDICAL	TITANIUM ALLOY	(주)솔고바이오메디칼	<NA>	<NA>
43346	(비급여 품목)삭제 및 삭제예정 품목	BM5002BF	2021-07-01	비씨플라스터 멸균반창고	전규격	1EA	0	LIBATAPE PHARMACEUTICAL CO.,LTD	면과 폴리에스테르 혼합물, 합성고무접착제, 부직포	(주)나음케어	<NA>	<NA>
25138	급여중지 및 급여중지 예정 품목	C5478724	2021-01-01	CLAVICLE PLATE	전규격	1EA	0	TRAUSON MEDICAL INSTRUMENT CO., LTD	TITANIUM	한국스트라이커	<NA>	<NA>
30200	급여중지 및 급여중지 예정 품목	L3011007	2014-11-01	CHECKCLEAN ONE PIECE COLOSTOMY	전규격	1EA	0	C&C MEDICAL	-	씨앤씨메디칼	<NA>	<NA>
43006	(비급여 품목)삭제 및 삭제예정 품목	BM1303XE	2020-07-01	DUAL FILTER SYRINGE	전규격	1EA	0	IMT KOREA	스테인레스강, 폴리프로필렌, 다이메틸 폴리실록세인, 에폭시	(주)아이엠티코리아	<NA>	<NA>
6404	급여 품목(인체조직 포함)	F1412098	2023-04-01	GUARDIAN	전규격	1EA	575950	BM KOREA	THERMOPLASTIC POLYURETHANE등	비엠코리아	<NA>	<NA>

Overview

Variables

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Decimal Number

Space Separator

Open Punctuation

Close Punctuation

Most occurring scripts

Most frequent character per script

Hangul

Common

Most occurring blocks

Most frequent character per block

ASCII

Hangul

Most occurring characters

Most occurring categories

Most frequent character per category

Uppercase Letter

Decimal Number

Most occurring scripts

Most frequent character per script

Latin

Common

Most occurring blocks

Most frequent character per block

ASCII

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Uppercase Letter

Lowercase Letter

Decimal Number

Other Punctuation

Math Symbol

Letter Number

Other Symbol

Close Punctuation

Open Punctuation

Space Separator

Dash Punctuation

Connector Punctuation

Other Number

Most occurring scripts

Most frequent character per script

Hangul

Latin

Common

Greek

Most occurring blocks

Most frequent character per block

ASCII

Hangul

Number Forms

CJK Compat

None

Letterlike Symbols

Math Operators

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Uppercase Letter

Lowercase Letter

Decimal Number

Other Punctuation

Other Symbol

Math Symbol

Space Separator

Close Punctuation

Open Punctuation

Dash Punctuation

Other Number

Most occurring scripts

Most frequent character per script

Hangul