Overview

Dataset statistics

Number of variables3
Number of observations120
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory2.9 KiB
Average record size in memory25.1 B

Variable types

DateTime1
Categorical1
Text1

Dataset

Description"계간가스산업" 논문현황에 대한 데이터로 2018년도부터 분기별로 발간되었으며, 각 분기별 발간된 논문에 대한 제목을 포함하고 있음
URLhttps://www.data.go.kr/data/15065820/fileData.do

Alerts

제목 has unique valuesUnique

Reproduction

Analysis started2023-12-12 08:06:53.960963
Analysis finished2023-12-12 08:06:54.387947
Duration0.43 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

연월
Date

Distinct21
Distinct (%)17.5%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
Minimum2018-03-01 00:00:00
Maximum2023-06-01 00:00:00
2023-12-12T17:06:54.453303image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-12T17:06:54.649517image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=21)

구분
Categorical

Distinct4
Distinct (%)3.3%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
여름호
35 
겨울호
31 
봄호
27 
가을호
27 

Length

Max length3
Median length3
Mean length2.775
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row봄호
2nd row봄호
3rd row봄호
4th row봄호
5th row봄호

Common Values

ValueCountFrequency (%)
여름호 35
29.2%
겨울호 31
25.8%
봄호 27
22.5%
가을호 27
22.5%

Length

2023-12-12T17:06:54.853919image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T17:06:55.039281image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
여름호 35
29.2%
겨울호 31
25.8%
봄호 27
22.5%
가을호 27
22.5%

제목
Text

UNIQUE 

Distinct120
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
2023-12-12T17:06:55.463864image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length44
Median length31
Mean length22.7
Min length12

Characters and Unicode

Total characters2724
Distinct characters264
Distinct categories6 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique120 ?
Unique (%)100.0%

Sample

1st row세계 에너지 수요전망 기관별 비교
2nd row미국산 LNG 수출 환경 변화
3rd row미국 북동부 LNG 수출사업 평가
4th row미국 헨리허브 현물가격 변동성의 결정요인 분석
5th row수소사회를 향한 일본 도시가스업계의 노력
ValueCountFrequency (%)
전망 26
 
3.7%
lng 25
 
3.6%
분석 23
 
3.3%
20
 
2.9%
영향 19
 
2.7%
동향 18
 
2.6%
시장 17
 
2.4%
따른 13
 
1.9%
최근 13
 
1.9%
천연가스 12
 
1.7%
Other values (325) 515
73.5%
2023-12-12T17:06:56.457646image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
581
 
21.3%
65
 
2.4%
62
 
2.3%
56
 
2.1%
51
 
1.9%
51
 
1.9%
50
 
1.8%
42
 
1.5%
40
 
1.5%
40
 
1.5%
Other values (254) 1686
61.9%

Most occurring categories

ValueCountFrequency (%)
Other Letter 1892
69.5%
Space Separator 581
 
21.3%
Uppercase Letter 144
 
5.3%
Decimal Number 90
 
3.3%
Other Punctuation 15
 
0.6%
Dash Punctuation 2
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
65
 
3.4%
62
 
3.3%
56
 
3.0%
51
 
2.7%
51
 
2.7%
50
 
2.6%
42
 
2.2%
40
 
2.1%
40
 
2.1%
34
 
1.8%
Other values (225) 1401
74.0%
Uppercase Letter
ValueCountFrequency (%)
G 32
22.2%
L 32
22.2%
N 31
21.5%
C 13
9.0%
S 8
 
5.6%
A 5
 
3.5%
E 5
 
3.5%
U 4
 
2.8%
M 3
 
2.1%
P 3
 
2.1%
Other values (6) 8
 
5.6%
Decimal Number
ValueCountFrequency (%)
2 37
41.1%
0 24
26.7%
1 13
 
14.4%
9 9
 
10.0%
3 4
 
4.4%
5 2
 
2.2%
4 1
 
1.1%
Other Punctuation
ValueCountFrequency (%)
: 7
46.7%
& 4
26.7%
· 2
 
13.3%
/ 2
 
13.3%
Space Separator
ValueCountFrequency (%)
581
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 2
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 1892
69.5%
Common 688
 
25.3%
Latin 144
 
5.3%

Most frequent character per script

Hangul
ValueCountFrequency (%)
65
 
3.4%
62
 
3.3%
56
 
3.0%
51
 
2.7%
51
 
2.7%
50
 
2.6%
42
 
2.2%
40
 
2.1%
40
 
2.1%
34
 
1.8%
Other values (225) 1401
74.0%
Latin
ValueCountFrequency (%)
G 32
22.2%
L 32
22.2%
N 31
21.5%
C 13
9.0%
S 8
 
5.6%
A 5
 
3.5%
E 5
 
3.5%
U 4
 
2.8%
M 3
 
2.1%
P 3
 
2.1%
Other values (6) 8
 
5.6%
Common
ValueCountFrequency (%)
581
84.4%
2 37
 
5.4%
0 24
 
3.5%
1 13
 
1.9%
9 9
 
1.3%
: 7
 
1.0%
3 4
 
0.6%
& 4
 
0.6%
- 2
 
0.3%
5 2
 
0.3%
Other values (3) 5
 
0.7%

Most occurring blocks

ValueCountFrequency (%)
Hangul 1892
69.5%
ASCII 830
30.5%
None 2
 
0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
581
70.0%
2 37
 
4.5%
G 32
 
3.9%
L 32
 
3.9%
N 31
 
3.7%
0 24
 
2.9%
C 13
 
1.6%
1 13
 
1.6%
9 9
 
1.1%
S 8
 
1.0%
Other values (18) 50
 
6.0%
Hangul
ValueCountFrequency (%)
65
 
3.4%
62
 
3.3%
56
 
3.0%
51
 
2.7%
51
 
2.7%
50
 
2.6%
42
 
2.2%
40
 
2.1%
40
 
2.1%
34
 
1.8%
Other values (225) 1401
74.0%
None
ValueCountFrequency (%)
· 2
100.0%

Correlations

2023-12-12T17:06:56.568799image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
연월구분
연월1.0000.987
구분0.9871.000

Missing values

2023-12-12T17:06:54.209513image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T17:06:54.345830image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

연월구분제목
02018-03-01봄호세계 에너지 수요전망 기관별 비교
12018-03-01봄호미국산 LNG 수출 환경 변화
22018-03-01봄호미국 북동부 LNG 수출사업 평가
32018-03-01봄호미국 헨리허브 현물가격 변동성의 결정요인 분석
42018-03-01봄호수소사회를 향한 일본 도시가스업계의 노력
52018-06-01여름호에너지전환 정책에 따른 LNG와 온실가스 감축 영향
62018-06-01여름호신재생 확대의 가스발전에 대한 영향 분석
72018-06-01여름호산업용 도시가스수요의 지역별 가격탄력성 차이 분석
82018-06-01여름호국제 LNG시장의 수급전망 변화
92018-06-01여름호북미 E&P기업의 재무실적과 헤지전략
연월구분제목
1102022-12-01겨울호2023년 국내 도시가스 수요 전망
1112023-03-01봄호최근 LNG 시장 변화와 미국 LNG 프로젝트 개발 영향
1122023-03-01봄호일본 LNG 공급안정성 확보 방안
1132023-03-01봄호장거리 액화수소 수송비용 절감 잠재력 분석
1142023-03-01봄호2022년 전력시장 분석과 향후 전망
1152023-06-01여름호청정수소 인증제도 동향과 가스산업 영향
1162023-06-01여름호미국 EPA화력발전소 온실가스 배출 규제안의 천연가스 시장 영향
1172023-06-01여름호에너지안보와 에너지전환 그리고 천연가스
1182023-06-01여름호최근 글로벌 에너지 투자 동향
1192023-06-01여름호국내 산업용 도시가스 수요의 가격탄력성 추정