Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 283 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.4% |
Total size in memory | 11.5 KiB |
Average record size in memory | 41.5 B |
Variable types
Categorical | 2 |
---|---|
Text | 2 |
Numeric | 1 |
Dataset
Description | 국토안전관리원에서 제공하는 데이터이며 국토안전관리원에서 생성된 연구보고서 등 발간목록(자료구분, 자료명, 사업구분, 발행년도)을 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15018181/fileData.do |
Dataset has 1 (0.4%) duplicate rows | Duplicates |
자료구분 is highly overall correlated with 사업구분 | High correlation |
사업구분 is highly overall correlated with 자료구분 | High correlation |
Reproduction
Analysis started | 2023-12-12 04:19:05.512971 |
---|---|
Analysis finished | 2023-12-12 04:19:06.225819 |
Duration | 0.71 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
자료구분
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
정책/연구 | |
---|---|
기술연구 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.5017668 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 기술연구 |
---|---|
2nd row | 기술연구 |
3rd row | 기술연구 |
4th row | 정책/연구 |
5th row | 정책/연구 |
Common Values
Value | Count | Frequency (%) |
정책/연구 | 142 | |
기술연구 | 141 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
정책/연구 | 142 | |
기술연구 | 141 |
자료명
Text
Distinct | 282 |
---|---|
Distinct (%) | 99.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
Length
Max length | 58 |
---|---|
Median length | 43 |
Mean length | 28.39576 |
Min length | 7 |
Characters and Unicode
Total characters | 8036 |
---|---|
Distinct characters | 370 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 4 ? |
Unique
Unique | 281 ? |
---|---|
Unique (%) | 99.3% |
Sample
1st row | 시설물 영상취득 방안 체계화 및 손상분석 자동화 방안 연구 |
---|---|
2nd row | 시설물 안전진단·점검의 자동화 추진방안 연구 |
3rd row | 수직형 시설물의 AI기반 비진입 스캐닝 자동화 시스템 개발 |
4th row | 건설안전 및 품질 관련 제도의 실효성 분석 및 개선 연구 |
5th row | 건설사고 재해율 저감을 위한 해외 선진사례 조사 및 분석 연구 |
Value | Count | Frequency (%) |
및 | 135 | 7.2% |
연구 | 97 | 5.2% |
개발 | 88 | 4.7% |
위한 | 44 | 2.3% |
시설물 | 30 | 1.6% |
유지관리 | 29 | 1.5% |
시스템 | 23 | 1.2% |
방안 | 21 | 1.1% |
관한 | 20 | 1.1% |
매뉴얼 | 18 | 1.0% |
Other values (843) | 1371 |
Most occurring characters
Value | Count | Frequency (%) |
1593 | 19.8% | |
구 | 172 | 2.1% |
기 | 169 | 2.1% |
안 | 162 | 2.0% |
개 | 154 | 1.9% |
및 | 139 | 1.7% |
시 | 137 | 1.7% |
연 | 130 | 1.6% |
한 | 126 | 1.6% |
발 | 126 | 1.6% |
Other values (360) | 5128 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 6025 | |
Space Separator | 1593 | 19.8% |
Uppercase Letter | 116 | 1.4% |
Decimal Number | 99 | 1.2% |
Other Punctuation | 75 | 0.9% |
Lowercase Letter | 44 | 0.5% |
Close Punctuation | 40 | 0.5% |
Open Punctuation | 40 | 0.5% |
Dash Punctuation | 3 | < 0.1% |
Letter Number | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 172 | 2.9% |
기 | 169 | 2.8% |
안 | 162 | 2.7% |
개 | 154 | 2.6% |
및 | 139 | 2.3% |
시 | 137 | 2.3% |
연 | 130 | 2.2% |
한 | 126 | 2.1% |
발 | 126 | 2.1% |
의 | 125 | 2.1% |
Other values (308) | 4585 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 18 | |
I | 16 | |
S | 11 | |
L | 9 | 7.8% |
D | 7 | 6.0% |
B | 7 | 6.0% |
M | 6 | 5.2% |
A | 6 | 5.2% |
T | 6 | 5.2% |
G | 6 | 5.2% |
Other values (8) | 24 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 8 | |
i | 6 | |
n | 5 | |
l | 4 | |
f | 4 | |
o | 3 | 6.8% |
r | 3 | 6.8% |
a | 2 | 4.5% |
v | 2 | 4.5% |
s | 2 | 4.5% |
Other values (5) | 5 |
Decimal Number
Value | Count | Frequency (%) |
2 | 43 | |
8 | 30 | |
1 | 15 | 15.2% |
3 | 6 | 6.1% |
0 | 3 | 3.0% |
4 | 1 | 1.0% |
7 | 1 | 1.0% |
Other Punctuation
Value | Count | Frequency (%) |
& | 15 | |
# | 15 | |
, | 15 | |
/ | 13 | |
· | 10 | |
. | 4 | 5.3% |
; | 3 | 4.0% |
Space Separator
Value | Count | Frequency (%) |
1593 |
Close Punctuation
Value | Count | Frequency (%) |
) | 40 |
Open Punctuation
Value | Count | Frequency (%) |
( | 40 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3 |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 6025 | |
Common | 1850 | 23.0% |
Latin | 161 | 2.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 172 | 2.9% |
기 | 169 | 2.8% |
안 | 162 | 2.7% |
개 | 154 | 2.6% |
및 | 139 | 2.3% |
시 | 137 | 2.3% |
연 | 130 | 2.2% |
한 | 126 | 2.1% |
발 | 126 | 2.1% |
의 | 125 | 2.1% |
Other values (308) | 4585 |
Latin
Value | Count | Frequency (%) |
C | 18 | 11.2% |
I | 16 | 9.9% |
S | 11 | 6.8% |
L | 9 | 5.6% |
e | 8 | 5.0% |
D | 7 | 4.3% |
B | 7 | 4.3% |
M | 6 | 3.7% |
A | 6 | 3.7% |
i | 6 | 3.7% |
Other values (24) | 67 |
Common
Value | Count | Frequency (%) |
1593 | ||
2 | 43 | 2.3% |
) | 40 | 2.2% |
( | 40 | 2.2% |
8 | 30 | 1.6% |
& | 15 | 0.8% |
# | 15 | 0.8% |
, | 15 | 0.8% |
1 | 15 | 0.8% |
/ | 13 | 0.7% |
Other values (8) | 31 | 1.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 6025 | |
ASCII | 2000 | 24.9% |
None | 10 | 0.1% |
Number Forms | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1593 | ||
2 | 43 | 2.1% |
) | 40 | 2.0% |
( | 40 | 2.0% |
8 | 30 | 1.5% |
C | 18 | 0.9% |
I | 16 | 0.8% |
& | 15 | 0.8% |
# | 15 | 0.8% |
, | 15 | 0.8% |
Other values (40) | 175 | 8.8% |
Hangul
Value | Count | Frequency (%) |
구 | 172 | 2.9% |
기 | 169 | 2.8% |
안 | 162 | 2.7% |
개 | 154 | 2.6% |
및 | 139 | 2.3% |
시 | 137 | 2.3% |
연 | 130 | 2.2% |
한 | 126 | 2.1% |
발 | 126 | 2.1% |
의 | 125 | 2.1% |
Other values (308) | 4585 |
None
Value | Count | Frequency (%) |
· | 10 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 1 |
사업구분
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 1.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
공통 | |
---|---|
교량 | |
수리시설 | |
건축 | |
터널 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.2332155 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 공통 |
---|---|
2nd row | 공통 |
3rd row | 터널 |
4th row | 공통 |
5th row | 공통 |
Common Values
Value | Count | Frequency (%) |
공통 | 143 | |
교량 | 54 | 19.1% |
수리시설 | 33 | 11.7% |
건축 | 30 | 10.6% |
터널 | 23 | 8.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
공통 | 143 | |
교량 | 54 | 19.1% |
수리시설 | 33 | 11.7% |
건축 | 30 | 10.6% |
터널 | 23 | 8.1% |
등록년도
Real number (ℝ)
Distinct | 16 |
---|---|
Distinct (%) | 5.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2009.1378 |
Minimum | 2004 |
---|---|
Maximum | 2023 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.6 KiB |
Quantile statistics
Minimum | 2004 |
---|---|
5-th percentile | 2004 |
Q1 | 2004 |
median | 2005 |
Q3 | 2016 |
95-th percentile | 2021 |
Maximum | 2023 |
Range | 19 |
Interquartile range (IQR) | 12 |
Descriptive statistics
Standard deviation | 6.2170052 |
---|---|
Coefficient of variation (CV) | 0.0030943648 |
Kurtosis | -0.89497057 |
Mean | 2009.1378 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 0.81044442 |
Sum | 568586 |
Variance | 38.651154 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2004 | 107 | |
2005 | 45 | |
2016 | 36 | 12.7% |
2007 | 26 | 9.2% |
2017 | 11 | 3.9% |
2014 | 9 | 3.2% |
2019 | 9 | 3.2% |
2023 | 7 | 2.5% |
2020 | 7 | 2.5% |
2022 | 6 | 2.1% |
Other values (6) | 20 | 7.1% |
Value | Count | Frequency (%) |
2004 | 107 | |
2005 | 45 | |
2007 | 26 | 9.2% |
2008 | 2 | 0.7% |
2009 | 1 | 0.4% |
2011 | 3 | 1.1% |
2012 | 6 | 2.1% |
2013 | 5 | 1.8% |
2014 | 9 | 3.2% |
2016 | 36 | 12.7% |
Value | Count | Frequency (%) |
2023 | 7 | 2.5% |
2022 | 6 | 2.1% |
2021 | 3 | 1.1% |
2020 | 7 | 2.5% |
2019 | 9 | 3.2% |
2017 | 11 | 3.9% |
2016 | 36 | |
2014 | 9 | 3.2% |
2013 | 5 | 1.8% |
2012 | 6 | 2.1% |
수행기간
Text
Distinct | 194 |
---|---|
Distinct (%) | 68.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
Length
Max length | 21 |
---|---|
Median length | 21 |
Mean length | 21 |
Min length | 21 |
Characters and Unicode
Total characters | 5943 |
---|---|
Distinct characters | 14 |
Distinct categories | 4 ? |
Distinct scripts | 1 ? |
Distinct blocks | 2 ? |
Unique
Unique | 153 ? |
---|---|
Unique (%) | 54.1% |
Sample
1st row | 2020-01-01~2022-12-31 |
---|---|
2nd row | 2022-01-01~2022-12-31 |
3rd row | 2020-01-01~2022-12-31 |
4th row | 2022-01-01~2022-12-31 |
5th row | 2022-01-01~2022-12-31 |
Value | Count | Frequency (%) |
1997-01-01~1997-12-31 | 10 | 3.5% |
2012-01-01~2013-12-31 | 7 | 2.5% |
1998-01-01~1998-12-31 | 6 | 2.1% |
2014-01-01~2015-12-31 | 5 | 1.8% |
1999-10-01~2001-02-28 | 5 | 1.8% |
2003-12-22∼2005-12-21 | 5 | 1.8% |
2013-01-01~2014-12-31 | 5 | 1.8% |
2009-01-01~2010-12-31 | 4 | 1.4% |
2022-01-01~2022-12-31 | 4 | 1.4% |
2019-01-01~2019-12-31 | 4 | 1.4% |
Other values (184) | 228 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 1345 | |
1 | 1161 | |
- | 1131 | |
2 | 925 | |
9 | 315 | 5.3% |
3 | 285 | 4.8% |
~ | 245 | 4.1% |
6 | 117 | 2.0% |
8 | 105 | 1.8% |
5 | 99 | 1.7% |
Other values (4) | 215 | 3.6% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 4528 | |
Dash Punctuation | 1131 | 19.0% |
Math Symbol | 283 | 4.8% |
Other Punctuation | 1 | < 0.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 1345 | |
1 | 1161 | |
2 | 925 | |
9 | 315 | 7.0% |
3 | 285 | 6.3% |
6 | 117 | 2.6% |
8 | 105 | 2.3% |
5 | 99 | 2.2% |
7 | 91 | 2.0% |
4 | 85 | 1.9% |
Math Symbol
Value | Count | Frequency (%) |
~ | 245 | |
∼ | 38 | 13.4% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1131 |
Other Punctuation
Value | Count | Frequency (%) |
, | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 5943 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 1345 | |
1 | 1161 | |
- | 1131 | |
2 | 925 | |
9 | 315 | 5.3% |
3 | 285 | 4.8% |
~ | 245 | 4.1% |
6 | 117 | 2.0% |
8 | 105 | 1.8% |
5 | 99 | 1.7% |
Other values (4) | 215 | 3.6% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 5905 | |
Math Operators | 38 | 0.6% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 1345 | |
1 | 1161 | |
- | 1131 | |
2 | 925 | |
9 | 315 | 5.3% |
3 | 285 | 4.8% |
~ | 245 | 4.1% |
6 | 117 | 2.0% |
8 | 105 | 1.8% |
5 | 99 | 1.7% |
Other values (3) | 177 | 3.0% |
Math Operators
Value | Count | Frequency (%) |
∼ | 38 |
자료구분 | 사업구분 | 등록년도 | |
---|---|---|---|
자료구분 | 1.000 | 0.846 | 0.234 |
사업구분 | 0.846 | 1.000 | 0.157 |
등록년도 | 0.234 | 0.157 | 1.000 |
자료구분 | 사업구분 | |
---|---|---|
자료구분 | 1.000 | 0.959 |
사업구분 | 0.959 | 1.000 |
등록년도 | 자료구분 | 사업구분 | |
---|---|---|---|
등록년도 | 1.000 | 0.196 | 0.064 |
자료구분 | 0.196 | 1.000 | 0.959 |
사업구분 | 0.064 | 0.959 | 1.000 |
자료구분 | 자료명 | 사업구분 | 등록년도 | 수행기간 | |
---|---|---|---|---|---|
0 | 기술연구 | 시설물 영상취득 방안 체계화 및 손상분석 자동화 방안 연구 | 공통 | 2023 | 2020-01-01~2022-12-31 |
1 | 기술연구 | 시설물 안전진단·점검의 자동화 추진방안 연구 | 공통 | 2023 | 2022-01-01~2022-12-31 |
2 | 기술연구 | 수직형 시설물의 AI기반 비진입 스캐닝 자동화 시스템 개발 | 터널 | 2023 | 2020-01-01~2022-12-31 |
3 | 정책/연구 | 건설안전 및 품질 관련 제도의 실효성 분석 및 개선 연구 | 공통 | 2023 | 2022-01-01~2022-12-31 |
4 | 정책/연구 | 건설사고 재해율 저감을 위한 해외 선진사례 조사 및 분석 연구 | 공통 | 2023 | 2022-01-01~2022-12-31 |
5 | 정책/연구 | 건설·시설안전 사회이슈 분석을 통한 시사점 도출 및 안전정책 발굴 연구 | 공통 | 2023 | 2022-01-01~2022-12-31 |
6 | 정책/연구 | 건설·시설 안전분야 정보관리체계 개선 및 활용방안 연구 | 공통 | 2023 | 2020-01-01~2022-12-31 |
7 | 정책/연구 | 통계 기반 국토안전 정책동향·전망 연구 | 공통 | 2022 | 2021-01-01~2021-12-31 |
8 | 정책/연구 | 드론 활용을 위한 시설물 안전점검 등에서의 시범적용 연구 | 공통 | 2022 | 2020-01-01~2021-12-31 |
9 | 기술연구 | 건축 마감재 안전점검 요령 및 보수·보강 기법 개발 | 건축 | 2022 | 2020-01-01~2021-12-31 |
자료구분 | 자료명 | 사업구분 | 등록년도 | 수행기간 | |
---|---|---|---|---|---|
273 | 기술연구 | 건축물의 옥내주차장 구조물에 대한 안전성 평가기법에 관한 연구 | 건축 | 2004 | 1998-01-01~1999-12-31 |
274 | 기술연구 | 건축물의 재건축 판정을 위한 평가방안 | 건축 | 2004 | 1999-12-13~2000-12-12 |
275 | 기술연구 | 고층건축물 구조안정성 및 사용성 장기계측 시스템을 이용한 상시 안전진단 기술개발 | 건축 | 2004 | 1999-11-15~2001-11-14 |
276 | 기술연구 | 기존건축물의 종합성능 평가모델 개발 | 건축 | 2004 | 2001-06-25~2002-10-24 |
277 | 기술연구 | 대형서스펜션 구조물의 유지관리기법 개발 | 건축 | 2004 | 2001-06-25~2002-10-24 |
278 | 기술연구 | 공동주택 장수명화를 위한 유지관리 시스템 개발 | 건축 | 2004 | 2001-08-30~2003-08-29 |
279 | 기술연구 | 재건축 판정을 위한 안전진단 기준 및 절차에 관한 연구 | 건축 | 2004 | 2003-01-29~2003-05-28 |
280 | 기술연구 | 건설교통안전관리 개선방안 연구(건축부분) | 건축 | 2004 | 2003-03-12~2003-07-09 |
281 | 기술연구 | 열적외선 장비를 활용한 건축물 진단기법 개발 | 건축 | 2005 | 2003-01-01~2004-12-31 |
282 | 기술연구 | 건축물의 유지관리를 위한 진단평가시스템 개발 | 건축 | 2005 | 2002-02-01~2004-10-27 |
Most frequently occurring
자료구분 | 자료명 | 사업구분 | 등록년도 | 수행기간 | # duplicates | |
---|---|---|---|---|---|---|
0 | 정책/연구 | 시설물 안전 및 유지관리 실태조사 방안 연구 | 공통 | 2016 | 2013-01-01~2014-12-31 | 2 |