gimi9 Pandas Profiling

Dataset statistics

Number of variables	5
Number of observations	10000
Missing cells	2
Missing cells (%)	< 0.1%
Duplicate rows	0
Duplicate rows (%)	0.0%
Total size in memory	488.3 KiB
Average record size in memory	50.0 B

Variable types

Numeric	2
Text	3

Dataset

Description	2024년 3월까지 한국수자원공사 보유 도서(39608권) 목록을 제공합니다.- 갱신주기 : 1년- 보관장소 : 본사(대전 대덕구 연축동)
Author	한국수자원공사
URL	https://www.data.go.kr/data/3072561/fileData.do

Alerts

`순번` is highly overall correlated with `출판년도`	High correlation
`출판년도` is highly overall correlated with `순번`	High correlation
`순번` has unique values	Unique

Reproduction

Analysis started	2024-04-21 02:47:41.202776
Analysis finished	2024-04-21 02:47:44.287251
Duration	3.08 seconds
Software version	ydata-profiling vv4.5.1
Download configuration	config.json

순번
Real number (ℝ)

HIGH CORRELATION UNIQUE

Distinct	10000
Distinct (%)	100.0%
Missing	0
Missing (%)	0.0%
Infinite	0
Infinite (%)	0.0%
Mean	19784.878

Minimum	8
Maximum	39604
Zeros	0
Zeros (%)	0.0%
Negative	0
Negative (%)	0.0%
Memory size	166.0 KiB

Quantile statistics

Minimum	8
5-th percentile	1986.9
Q1	9938.75
median	19719.5
Q3	29768.5
95-th percentile	37482.2
Maximum	39604
Range	39596
Interquartile range (IQR)	19829.75

Descriptive statistics

Standard deviation	11408.891
Coefficient of variation (CV)	0.57664702
Kurtosis	-1.2104049
Mean	19784.878
Median Absolute Deviation (MAD)	9911
Skewness	0.0029217637
Sum	1.9784878 × 10⁸
Variance	1.3016279 × 10⁸
Monotonicity	Not monotonic

Histogram with fixed size bins (bins=50)

Value	Count	Frequency (%)
28289	1	< 0.1%
35059	1	< 0.1%
18390	1	< 0.1%
7774	1	< 0.1%
21570	1	< 0.1%
6674	1	< 0.1%
27005	1	< 0.1%
14002	1	< 0.1%
12534	1	< 0.1%
23118	1	< 0.1%
Other values (9990)	9990	99.9%

Minimum 10 values
Maximum 10 values

Value	Count	Frequency (%)
8	1	< 0.1%
12	1	< 0.1%
14	1	< 0.1%
20	1	< 0.1%
25	1	< 0.1%
27	1	< 0.1%
35	1	< 0.1%
36	1	< 0.1%
39	1	< 0.1%
44	1	< 0.1%

Value	Count	Frequency (%)
39604	1	< 0.1%
39601	1	< 0.1%
39596	1	< 0.1%
39594	1	< 0.1%
39591	1	< 0.1%
39587	1	< 0.1%
39583	1	< 0.1%
39573	1	< 0.1%
39564	1	< 0.1%
39553	1	< 0.1%

서명
Text

Distinct	9924
Distinct (%)	99.2%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	318
Median length	124
Mean length	28.7627
Min length	1

Characters and Unicode

Total characters	287627
Distinct characters	1739
Distinct categories	15 ?
Distinct scripts	7 ?
Distinct blocks	11 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	9857 ?
Unique (%)	98.6%

Sample

1st row	영산강(하류) 하천기본계획 보고서
2nd row	척산천 하천기본계획 보고서
3rd row	추계학적 기법을 적용한 홍수예측체계 개선
4th row	도시계획현황:2007
5th row	강희대제(12)-제왕삼부곡 제1작

Value	Count	Frequency (%)
	2748	5.2%
of	789	1.5%
및	734	1.4%
연구	615	1.2%
and	609	1.2%
water	467	0.9%
위한	424	0.8%
the	389	0.7%
관한	312	0.6%
in	282	0.5%
Other values (22993)	45521	86.1%

Most occurring characters

Value	Count	Frequency (%)
	43403	15.1%
e	6336	2.2%
n	5307	1.8%
a	4963	1.7%
o	4876	1.7%
i	4632	1.6%
r	4452	1.5%
t	4429	1.5%
E	3799	1.3%
s	3331	1.2%
Other values (1729)	202099	70.3%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	126631	44.0%
Lowercase Letter	56783	19.7%
Space Separator	43403	15.1%
Uppercase Letter	37409	13.0%
Decimal Number	10660	3.7%
Other Punctuation	5745	2.0%
Close Punctuation	2900	1.0%
Open Punctuation	2895	1.0%
Dash Punctuation	905	0.3%
Math Symbol	169	0.1%
Other values (5)	127	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
의	2897	2.3%
기	2701	2.1%
수	2385	1.9%
지	2244	1.8%
한	2220	1.8%
사	2167	1.7%
서	1728	1.4%
보	1723	1.4%
구	1701	1.3%
계	1686	1.3%
Other values (1628)	105179	83.1%

Lowercase Letter

Value	Count	Frequency (%)
e	6336	11.2%
n	5307	9.3%
a	4963	8.7%
o	4876	8.6%
i	4632	8.2%
r	4452	7.8%
t	4429	7.8%
s	3331	5.9%
l	2559	4.5%
c	2191	3.9%
Other values (17)	13707	24.1%

Uppercase Letter

Value	Count	Frequency (%)
E	3799	10.2%
A	3205	8.6%
N	3051	8.2%
I	2806	7.5%
O	2756	7.4%
T	2712	7.2%
R	2705	7.2%
S	2515	6.7%
C	1915	5.1%
L	1489	4.0%
Other values (16)	10456	28.0%

Other Punctuation

Value	Count	Frequency (%)
;	2331	40.6%
:	1410	24.5%
,	878	15.3%
.	694	12.1%
·	104	1.8%
&	89	1.5%
/	87	1.5%
?	54	0.9%
!	46	0.8%
'	39	0.7%
Other values (4)	13	0.2%

Decimal Number

Value	Count	Frequency (%)
1	2452	23.0%
2	1795	16.8%
0	1784	16.7%
9	1347	12.6%
3	776	7.3%
5	599	5.6%
8	566	5.3%
4	509	4.8%
6	424	4.0%
7	408	3.8%

Letter Number

Value	Count	Frequency (%)
Ⅱ	47	40.9%
Ⅰ	44	38.3%
Ⅲ	12	10.4%
Ⅳ	8	7.0%
Ⅴ	3	2.6%
Ⅵ	1	0.9%

Math Symbol

Value	Count	Frequency (%)
~	158	93.5%
+	6	3.6%
=	3	1.8%
<	1	0.6%
>	1	0.6%

Close Punctuation

Value	Count	Frequency (%)
)	2864	98.8%
]	36	1.2%

Open Punctuation

Value	Count	Frequency (%)
(	2862	98.9%
[	33	1.1%

Initial Punctuation

Value	Count	Frequency (%)
‘	2	66.7%
“	1	33.3%

Other Number

Value	Count	Frequency (%)
₂	2	66.7%
⑥	1	33.3%

Other Symbol

Value	Count	Frequency (%)
°	1	50.0%
®	1	50.0%

Space Separator

Value	Count	Frequency (%)
	43403	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	905	100.0%

Modifier Symbol

Value	Count	Frequency (%)
`	4	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	123748	43.0%
Latin	94306	32.8%
Common	66689	23.2%
Han	2081	0.7%
Katakana	404	0.1%
Hiragana	398	0.1%
Greek	1	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
의	2897	2.3%
기	2701	2.2%
수	2385	1.9%
지	2244	1.8%
한	2220	1.8%
사	2167	1.8%
서	1728	1.4%
보	1723	1.4%
구	1701	1.4%
계	1686	1.4%
Other values (1045)	102296	82.7%

Han

Value	Count	Frequency (%)
水	100	4.8%
設	36	1.7%
計	32	1.5%
技	32	1.5%
工	29	1.4%
術	29	1.4%
管	27	1.3%
第	25	1.2%
川	25	1.2%
河	24	1.2%
Other values (465)	1722	82.7%

Latin

Value	Count	Frequency (%)
e	6336	6.7%
n	5307	5.6%
a	4963	5.3%
o	4876	5.2%
i	4632	4.9%
r	4452	4.7%
t	4429	4.7%
E	3799	4.0%
s	3331	3.5%
A	3205	3.4%
Other values (48)	48976	51.9%

Katakana

Value	Count	Frequency (%)
ム	31	7.7%
リ	28	6.9%
ン	27	6.7%
ダ	27	6.7%
ト	23	5.7%
ス	22	5.4%
ク	18	4.5%
ル	14	3.5%
ツ	14	3.5%
ズ	12	3.0%
Other values (48)	188	46.5%

Hiragana

Value	Count	Frequency (%)
の	126	31.7%
と	42	10.6%
る	24	6.0%
に	23	5.8%
す	15	3.8%
た	9	2.3%
で	9	2.3%
し	9	2.3%
え	9	2.3%
を	9	2.3%
Other values (40)	123	30.9%

Common

Value	Count	Frequency (%)
	43403	65.1%
)	2864	4.3%
(	2862	4.3%
1	2452	3.7%
;	2331	3.5%
2	1795	2.7%
0	1784	2.7%
:	1410	2.1%
9	1347	2.0%
-	905	1.4%
Other values (32)	5536	8.3%

Greek

Value	Count	Frequency (%)
φ	1	100.0%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	160765	55.9%
Hangul	123291	42.9%
CJK	2050	0.7%
Compat Jamo	457	0.2%
Katakana	404	0.1%
Hiragana	398	0.1%
Number Forms	115	< 0.1%
None	112	< 0.1%
CJK Compat Ideographs	31	< 0.1%
Punctuation	3	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	43403	27.0%
e	6336	3.9%
n	5307	3.3%
a	4963	3.1%
o	4876	3.0%
i	4632	2.9%
r	4452	2.8%
t	4429	2.8%
E	3799	2.4%
s	3331	2.1%
Other values (75)	75237	46.8%

Hangul

Value	Count	Frequency (%)
의	2897	2.3%
기	2701	2.2%
수	2385	1.9%
지	2244	1.8%
한	2220	1.8%
사	2167	1.8%
서	1728	1.4%
보	1723	1.4%
구	1701	1.4%
계	1686	1.4%
Other values (1042)	101839	82.6%

Compat Jamo

Value	Count	Frequency (%)
ㆍ	446	97.6%
ㅡ	10	2.2%
ㅂ	1	0.2%

Hiragana

Value	Count	Frequency (%)
の	126	31.7%
と	42	10.6%
る	24	6.0%
に	23	5.8%
す	15	3.8%
た	9	2.3%
で	9	2.3%
し	9	2.3%
え	9	2.3%
を	9	2.3%
Other values (40)	123	30.9%

None

Value	Count	Frequency (%)
·	104	92.9%
：	2	1.8%
₂	2	1.8%
°	1	0.9%
®	1	0.9%
．	1	0.9%
φ	1	0.9%

CJK

Value	Count	Frequency (%)
水	100	4.9%
設	36	1.8%
計	32	1.6%
技	32	1.6%
工	29	1.4%
術	29	1.4%
管	27	1.3%
第	25	1.2%
川	25	1.2%
河	24	1.2%
Other values (450)	1691	82.5%

Number Forms

Value	Count	Frequency (%)
Ⅱ	47	40.9%
Ⅰ	44	38.3%
Ⅲ	12	10.4%
Ⅳ	8	7.0%
Ⅴ	3	2.6%
Ⅵ	1	0.9%

Katakana

Value	Count	Frequency (%)
ム	31	7.7%
リ	28	6.9%
ン	27	6.7%
ダ	27	6.7%
ト	23	5.7%
ス	22	5.4%
ク	18	4.5%
ル	14	3.5%
ツ	14	3.5%
ズ	12	3.0%
Other values (48)	188	46.5%

CJK Compat Ideographs

Value	Count	Frequency (%)
利	5	16.1%
力	4	12.9%
流	3	9.7%
論	3	9.7%
金	3	9.7%
劣	2	6.5%
陸	2	6.5%
例	2	6.5%
理	1	3.2%
洛	1	3.2%
Other values (5)	5	16.1%

Punctuation

Value	Count	Frequency (%)
‘	2	66.7%
“	1	33.3%

Enclosed Alphanum

Value	Count	Frequency (%)
⑥	1	100.0%

저자
Text

Distinct	6368
Distinct (%)	63.7%
Missing	1
Missing (%)	< 0.1%
Memory size	156.2 KiB

Length

Max length	103
Median length	73
Mean length	11.869787
Min length	1

Characters and Unicode

Total characters	118686
Distinct characters	965
Distinct categories	10 ?
Distinct scripts	5 ?
Distinct blocks	7 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	5487 ?
Unique (%)	54.9%

Sample

1st row	국토해양부 익산지방국토관리청 편;현대엔지니어링 편;삼안 편
2nd row	경상북도 편
3rd row	국토해양부 한강홍수통제소 편
4th row	국토해양부 편;한국토지공사 편
5th row	얼웨허 저;홍순도 역

Value	Count	Frequency (%)
편	5020	18.3%
저	3935	14.3%
역	919	3.3%
건설교통부	267	1.0%
of	216	0.8%
건설부	215	0.8%
국토해양부	187	0.7%
한국수자원공사	115	0.4%
수자원연구소	109	0.4%
한국건설기술연구원	103	0.4%
Other values (9076)	16410	59.7%

Most occurring characters

Value	Count	Frequency (%)
	17627	14.9%
편	6275	5.3%
저	6079	5.1%
;	3432	2.9%
국	1763	1.5%
원	1594	1.3%
e	1591	1.3%
A	1502	1.3%
,	1460	1.2%
부	1448	1.2%
Other values (955)	75915	64.0%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	67214	56.6%
Space Separator	17627	14.9%
Uppercase Letter	14220	12.0%
Lowercase Letter	13275	11.2%
Other Punctuation	6117	5.2%
Dash Punctuation	130	0.1%
Decimal Number	66	0.1%
Open Punctuation	18	< 0.1%
Close Punctuation	18	< 0.1%
Modifier Symbol	1	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
편	6275	9.3%
저	6079	9.0%
국	1763	2.6%
원	1594	2.4%
부	1448	2.2%
한	1318	2.0%
수	1119	1.7%
이	1103	1.6%
연	1100	1.6%
건	1065	1.6%
Other values (882)	44350	66.0%

Lowercase Letter

Value	Count	Frequency (%)
e	1591	12.0%
a	1298	9.8%
r	1254	9.4%
n	1193	9.0%
o	1170	8.8%
i	1010	7.6%
t	810	6.1%
s	728	5.5%
l	671	5.1%
h	410	3.1%
Other values (16)	3140	23.7%

Uppercase Letter

Value	Count	Frequency (%)
A	1502	10.6%
E	1270	8.9%
R	961	6.8%
C	939	6.6%
S	927	6.5%
I	878	6.2%
N	849	6.0%
O	833	5.9%
T	626	4.4%
L	567	4.0%
Other values (16)	4868	34.2%

Decimal Number

Value	Count	Frequency (%)
0	20	30.3%
2	15	22.7%
1	10	15.2%
5	5	7.6%
9	4	6.1%
6	3	4.5%
3	3	4.5%
7	3	4.5%
4	2	3.0%
8	1	1.5%

Other Punctuation

Value	Count	Frequency (%)
;	3432	56.1%
,	1460	23.9%
.	1191	19.5%
&	21	0.3%
/	9	0.1%
·	4	0.1%

Space Separator

Value	Count	Frequency (%)
	17627	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	130	100.0%

Open Punctuation

Value	Count	Frequency (%)
(	18	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	18	100.0%

Modifier Symbol

Value	Count	Frequency (%)
`	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	66727	56.2%
Latin	27495	23.2%
Common	23977	20.2%
Han	468	0.4%
Katakana	19	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
편	6275	9.4%
저	6079	9.1%
국	1763	2.6%
원	1594	2.4%
부	1448	2.2%
한	1318	2.0%
수	1119	1.7%
이	1103	1.7%
연	1100	1.6%
건	1065	1.6%
Other values (675)	43863	65.7%

Han

Value	Count	Frequency (%)
會	23	4.9%
協	15	3.2%
水	13	2.8%
門	9	1.9%
鐵	9	1.9%
野	9	1.9%
管	9	1.9%
土	8	1.7%
幸	8	1.7%
設	8	1.7%
Other values (188)	357	76.3%

Latin

Value	Count	Frequency (%)
e	1591	5.8%
A	1502	5.5%
a	1298	4.7%
E	1270	4.6%
r	1254	4.6%
n	1193	4.3%
o	1170	4.3%
i	1010	3.7%
R	961	3.5%
C	939	3.4%
Other values (42)	15307	55.7%

Common

Value	Count	Frequency (%)
	17627	73.5%
;	3432	14.3%
,	1460	6.1%
.	1191	5.0%
-	130	0.5%
&	21	0.1%
0	20	0.1%
(	18	0.1%
)	18	0.1%
2	15	0.1%
Other values (11)	45	0.2%

Katakana

Value	Count	Frequency (%)
ダ	3	15.8%
ム	3	15.8%
ン	3	15.8%
ト	2	10.5%
リ	2	10.5%
ク	2	10.5%
コ	2	10.5%
セ	1	5.3%
タ	1	5.3%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	66718	56.2%
ASCII	51468	43.4%
CJK	466	0.4%
Katakana	19	< 0.1%
Compat Jamo	9	< 0.1%
None	4	< 0.1%
CJK Compat Ideographs	2	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	17627	34.2%
;	3432	6.7%
e	1591	3.1%
A	1502	2.9%
,	1460	2.8%
a	1298	2.5%
E	1270	2.5%
r	1254	2.4%
n	1193	2.3%
.	1191	2.3%
Other values (62)	19650	38.2%

Hangul

Value	Count	Frequency (%)
편	6275	9.4%
저	6079	9.1%
국	1763	2.6%
원	1594	2.4%
부	1448	2.2%
한	1318	2.0%
수	1119	1.7%
이	1103	1.7%
연	1100	1.6%
건	1065	1.6%
Other values (674)	43854	65.7%

CJK

Value	Count	Frequency (%)
會	23	4.9%
協	15	3.2%
水	13	2.8%
門	9	1.9%
鐵	9	1.9%
野	9	1.9%
管	9	1.9%
土	8	1.7%
幸	8	1.7%
設	8	1.7%
Other values (186)	355	76.2%

Compat Jamo

Value	Count	Frequency (%)
ㆍ	9	100.0%

None

Value	Count	Frequency (%)
·	4	100.0%

Katakana

Value	Count	Frequency (%)
ダ	3	15.8%
ム	3	15.8%
ン	3	15.8%
ト	2	10.5%
リ	2	10.5%
ク	2	10.5%
コ	2	10.5%
セ	1	5.3%
タ	1	5.3%

CJK Compat Ideographs

Value	Count	Frequency (%)
旅	1	50.0%
林	1	50.0%

출판사
Text

Distinct	3064
Distinct (%)	30.6%
Missing	1
Missing (%)	< 0.1%
Memory size	156.2 KiB

Length

Max length	50
Median length	47
Mean length	6.8048805
Min length	1

Characters and Unicode

Total characters	68042
Distinct characters	748
Distinct categories	12 ?
Distinct scripts	6 ?
Distinct blocks	9 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	2035 ?
Unique (%)	20.4%

Sample

1st row	국토해양부
2nd row	경상북도
3rd row	국토해양부
4th row	국토해양부
5th row	더봄

Value	Count	Frequency (%)
한국수자원공사	607	5.0%
건설교통부	267	2.2%
of	212	1.7%
국토해양부	184	1.5%
국토연구원	174	1.4%
건설부	174	1.4%
환경부	170	1.4%
산업기지개발공사	137	1.1%
충북대학교	132	1.1%
university	115	0.9%
Other values (3154)	10020	82.2%

Most occurring characters

Value	Count	Frequency (%)
	2204	3.2%
국	2027	3.0%
원	1867	2.7%
사	1754	2.6%
한	1523	2.2%
공	1250	1.8%
부	1218	1.8%
A	1215	1.8%
e	1198	1.8%
E	1170	1.7%
Other values (738)	52616	77.3%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	42704	62.8%
Uppercase Letter	11995	17.6%
Lowercase Letter	10416	15.3%
Space Separator	2204	3.2%
Other Punctuation	482	0.7%
Dash Punctuation	106	0.2%
Decimal Number	100	0.1%
Close Punctuation	15	< 0.1%
Open Punctuation	15	< 0.1%
Other Symbol	3	< 0.1%
Other values (2)	2	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
국	2027	4.7%
원	1867	4.4%
사	1754	4.1%
한	1523	3.6%
공	1250	2.9%
부	1218	2.9%
학	1167	2.7%
대	1066	2.5%
교	1007	2.4%
수	976	2.3%
Other values (663)	28849	67.6%

Uppercase Letter

Value	Count	Frequency (%)
A	1215	10.1%
E	1170	9.8%
S	1013	8.4%
I	908	7.6%
C	823	6.9%
R	773	6.4%
N	729	6.1%
O	684	5.7%
U	525	4.4%
T	502	4.2%
Other values (16)	3653	30.5%

Lowercase Letter

Value	Count	Frequency (%)
e	1198	11.5%
i	965	9.3%
r	938	9.0%
n	927	8.9%
o	885	8.5%
s	833	8.0%
a	747	7.2%
t	599	5.8%
l	581	5.6%
c	358	3.4%
Other values (15)	2385	22.9%

Decimal Number

Value	Count	Frequency (%)
2	49	49.0%
1	38	38.0%
0	6	6.0%
3	2	2.0%
6	1	1.0%
8	1	1.0%
7	1	1.0%
5	1	1.0%
4	1	1.0%

Other Punctuation

Value	Count	Frequency (%)
.	311	64.5%
&	91	18.9%
,	41	8.5%
·	34	7.1%
/	5	1.0%

Close Punctuation

Value	Count	Frequency (%)
)	14	93.3%
]	1	6.7%

Open Punctuation

Value	Count	Frequency (%)
(	14	93.3%
[	1	6.7%

Other Symbol

Value	Count	Frequency (%)
♥	2	66.7%
㈜	1	33.3%

Space Separator

Value	Count	Frequency (%)
	2204	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	106	100.0%

Modifier Symbol

Value	Count	Frequency (%)
`	1	100.0%

Math Symbol

Value	Count	Frequency (%)
\|	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	42421	62.3%
Latin	22411	32.9%
Common	2926	4.3%
Han	250	0.4%
Katakana	23	< 0.1%
Hiragana	11	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
국	2027	4.8%
원	1867	4.4%
사	1754	4.1%
한	1523	3.6%
공	1250	2.9%
부	1218	2.9%
학	1167	2.8%
대	1066	2.5%
교	1007	2.4%
수	976	2.3%
Other values (550)	28566	67.3%

Han

Value	Count	Frequency (%)
會	22	8.8%
協	15	6.0%
水	12	4.8%
學	10	4.0%
鐵	9	3.6%
門	9	3.6%
管	9	3.6%
工	8	3.2%
設	7	2.8%
版	5	2.0%
Other values (85)	144	57.6%

Latin

Value	Count	Frequency (%)
A	1215	5.4%
e	1198	5.3%
E	1170	5.2%
S	1013	4.5%
i	965	4.3%
r	938	4.2%
n	927	4.1%
I	908	4.1%
o	885	3.9%
s	833	3.7%
Other values (41)	12359	55.1%

Common

Value	Count	Frequency (%)
	2204	75.3%
.	311	10.6%
-	106	3.6%
&	91	3.1%
2	49	1.7%
,	41	1.4%
1	38	1.3%
·	34	1.2%
)	14	0.5%
(	14	0.5%
Other values (13)	24	0.8%

Katakana

Value	Count	Frequency (%)
ム	4	17.4%
ダ	3	13.0%
コ	2	8.7%
ク	2	8.7%
リ	2	8.7%
ト	2	8.7%
ン	2	8.7%
ヴ	1	4.3%
ル	1	4.3%
ネ	1	4.3%
Other values (3)	3	13.0%

Hiragana

Value	Count	Frequency (%)
ぎ	2	18.2%
い	2	18.2%
よ	2	18.2%
う	2	18.2%
せ	2	18.2%
ち	1	9.1%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	42411	62.3%
ASCII	25301	37.2%
CJK	246	0.4%
None	35	0.1%
Katakana	23	< 0.1%
Hiragana	11	< 0.1%
Compat Jamo	9	< 0.1%
CJK Compat Ideographs	4	< 0.1%
Misc Symbols	2	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	2204	8.7%
A	1215	4.8%
e	1198	4.7%
E	1170	4.6%
S	1013	4.0%
i	965	3.8%
r	938	3.7%
n	927	3.7%
I	908	3.6%
o	885	3.5%
Other values (62)	13878	54.9%

Hangul

Value	Count	Frequency (%)
국	2027	4.8%
원	1867	4.4%
사	1754	4.1%
한	1523	3.6%
공	1250	2.9%
부	1218	2.9%
학	1167	2.8%
대	1066	2.5%
교	1007	2.4%
수	976	2.3%
Other values (547)	28556	67.3%

None

Value	Count	Frequency (%)
·	34	97.1%
㈜	1	2.9%

CJK

Value	Count	Frequency (%)
會	22	8.9%
協	15	6.1%
水	12	4.9%
學	10	4.1%
鐵	9	3.7%
門	9	3.7%
管	9	3.7%
工	8	3.3%
設	7	2.8%
版	5	2.0%
Other values (81)	140	56.9%

Compat Jamo

Value	Count	Frequency (%)
ㆍ	8	88.9%
ㅣ	1	11.1%

Katakana

Value	Count	Frequency (%)
ム	4	17.4%
ダ	3	13.0%
コ	2	8.7%
ク	2	8.7%
リ	2	8.7%
ト	2	8.7%
ン	2	8.7%
ヴ	1	4.3%
ル	1	4.3%
ネ	1	4.3%
Other values (3)	3	13.0%

Misc Symbols

Value	Count	Frequency (%)
♥	2	100.0%

Hiragana

Value	Count	Frequency (%)
ぎ	2	18.2%
い	2	18.2%
よ	2	18.2%
う	2	18.2%
せ	2	18.2%
ち	1	9.1%

CJK Compat Ideographs

Value	Count	Frequency (%)
理	1	25.0%
鹿	1	25.0%
旅	1	25.0%
漏	1	25.0%

출판년도
Real number (ℝ)

HIGH CORRELATION

Distinct	95
Distinct (%)	0.9%
Missing	0
Missing (%)	0.0%
Infinite	0
Infinite (%)	0.0%
Mean	2000.819

Minimum	1923
Maximum	2023
Zeros	0
Zeros (%)	0.0%
Negative	0
Negative (%)	0.0%
Memory size	166.0 KiB

Quantile statistics

Minimum	1923
5-th percentile	1972
Q1	1992
median	2003
Q3	2013
95-th percentile	2020
Maximum	2023
Range	100
Interquartile range (IQR)	21

Descriptive statistics

Standard deviation	14.995097
Coefficient of variation (CV)	0.0074944793
Kurtosis	0.61243218
Mean	2000.819
Median Absolute Deviation (MAD)	10
Skewness	-0.83042746
Sum	20008190
Variance	224.85292
Monotonicity	Not monotonic

Histogram with fixed size bins (bins=50)

Value	Count	Frequency (%)
2009	327	3.3%
2010	319	3.2%
2008	315	3.1%
2013	315	3.1%
2007	309	3.1%
1994	299	3.0%
2020	296	3.0%
2012	296	3.0%
2016	287	2.9%
2006	285	2.9%
Other values (85)	6952	69.5%

Minimum 10 values
Maximum 10 values

Value	Count	Frequency (%)
1923	1	< 0.1%
1926	1	< 0.1%
1927	1	< 0.1%
1929	1	< 0.1%
1930	1	< 0.1%
1932	1	< 0.1%
1934	2	< 0.1%
1935	1	< 0.1%
1936	3	< 0.1%
1937	3	< 0.1%

Value	Count	Frequency (%)
2023	77	0.8%
2022	196	2.0%
2021	220	2.2%
2020	296	3.0%
2019	212	2.1%
2018	221	2.2%
2017	218	2.2%
2016	287	2.9%
2015	237	2.4%
2014	222	2.2%

순번
출판년도

출판년도
순번

출판년도
순번

Phik (φk)
Auto

Heatmap
Table

	순번	출판년도
순번	1.000	0.950
출판년도	0.950	1.000

Heatmap
Table

	순번	출판년도
순번	1.000	1.000
출판년도	1.000	1.000

A simple visualization of nullity by column.

Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

First rows
Last rows

	순번	서명	저자	출판사	출판년도
28288	28289	영산강(하류) 하천기본계획 보고서	국토해양부 익산지방국토관리청 편;현대엔지니어링 편;삼안 편	국토해양부	2011
27467	27468	척산천 하천기본계획 보고서	경상북도 편	경상북도	2010
29596	29597	추계학적 기법을 적용한 홍수예측체계 개선	국토해양부 한강홍수통제소 편	국토해양부	2012
24312	24313	도시계획현황:2007	국토해양부 편;한국토지공사 편	국토해양부	2008
32804	32805	강희대제(12)-제왕삼부곡 제1작	얼웨허 저;홍순도 역	더봄	2016
6036	6037	Stochastic Analysis of Drought Phenomena	US Army Corps of Engineers 편	US Army Corps of Engineers	1985
25539	25540	뇌를 움직이는 메모	사카토 켄지 저;김하경 역	비즈니스세상	2009
38908	38909	소리튠 영어혁명 ; 30년 영알못도 귀가 뚫리고 입이 트이는	이정은 저	미다스북스	2022
9455	9456	레이다를 이용한 단시간 강우예측 결과의 정성 및 정량적인평가(2) ; 모델 데스트 및 현업화	기상연구소 편	기상연구소	1991
3793	3794	Water quality evaluation of proposed twin valley lake wild rice river, minnesota	Ford, Dennis E. 저;Thornton, Kent W. 저;Ford, W.Bryan 저	U.S.Army Engineer Waterways Experiment Station	1979

	순번	서명	저자	출판사	출판년도
4248	4249	기술지도서(40) ; 도로의선형설계	건설부 편	정우사	1980
15724	15725	New 오성식 생활영어 SOS guide book	두산출판 BG 편	두산출판 BG	1999
17016	17017	제8회 세계 물의 날 기념 물 심포지엄 2000 ; 21세기의 물	홍보실 편;한국물학술단체연합회 편	한국수자원공사	2000
30735	30736	지역활성화를 위한 지방하천 정비사업 개선방향 연구	차주영 저;이상민 저	건축도시공간연구소	2013
12608	12609	고도FCS-BIOFILM시스템에 의한 하수처리에 관한 연구	김정현 저	동아대학교대학원	1995
22498	22499	한국수자원학회지:2006(V.39 No.1-6)	한국수자원학회 편	한국수자원학회	2006
13390	13391	경영실적보고서(관리제도):1995	경영관리실 편	한국수자원공사	1996
15142	15143	댐 일본(ダム日本):1998년 9월호	일본댐협회 편	일본댐협회	1998
8223	8224	상수도시설개량 및 보완사업 수리용량 및 구조계산서(1)	충주시 편	충주시	1989
19461	19462	에코 에너지	호프만, 피터 저;강호산 역	생각의 나무	2003

Overview

Variables

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Other Punctuation

Decimal Number

Letter Number

Math Symbol

Close Punctuation

Open Punctuation

Initial Punctuation

Other Number

Other Symbol

Space Separator

Dash Punctuation

Modifier Symbol

Most occurring scripts

Most frequent character per script

Hangul

Han

Latin

Katakana

Hiragana

Common

Greek

Most occurring blocks

Most frequent character per block

ASCII

Hangul

Compat Jamo

Hiragana

None

CJK

Number Forms

Katakana

CJK Compat Ideographs

Punctuation

Enclosed Alphanum

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Decimal Number

Other Punctuation

Space Separator

Dash Punctuation

Open Punctuation

Close Punctuation

Modifier Symbol

Most occurring scripts

Most frequent character per script

Hangul

Han

Latin

Common

Katakana

Most occurring blocks

Most frequent character per block

ASCII

Hangul

CJK

Compat Jamo

None

Katakana

CJK Compat Ideographs

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Uppercase Letter

Lowercase Letter

Decimal Number

Other Punctuation

Close Punctuation