Dataset statistics
Number of variables | 9 |
---|---|
Number of observations | 25 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 2.0 KiB |
Average record size in memory | 81.3 B |
Variable types
Categorical | 3 |
---|---|
Text | 2 |
Numeric | 3 |
DateTime | 1 |
Dataset
Description | 제주특별자치도 서귀포시에서 추진하고 있는 각종 지역투자사업과 관련한 데이터로 구분(국책/민자), 사업명, 위치, 규모, 사업기간, 총사업비 등의 정보를 제공합니다. |
---|---|
Author | 제주특별자치도 서귀포시 |
URL | https://www.data.go.kr/data/15034170/fileData.do |
데이터기준일자 has constant value "" | Constant |
규모(천 제곱미터) is highly overall correlated with 총사업비(억원) and 1 other fields | High correlation |
총사업비(억원) is highly overall correlated with 규모(천 제곱미터) and 1 other fields | High correlation |
구분 is highly overall correlated with 규모(천 제곱미터) and 1 other fields | High correlation |
사업명 has unique values | Unique |
규모(천 제곱미터) has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 00:51:52.327904 |
---|---|
Analysis finished | 2023-12-12 00:51:54.275366 |
Duration | 1.95 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
구분
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 8.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 332.0 B |
민자사업 | |
---|---|
국책사업 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 국책사업 |
---|---|
2nd row | 국책사업 |
3rd row | 국책사업 |
4th row | 국책사업 |
5th row | 국책사업 |
Common Values
Value | Count | Frequency (%) |
민자사업 | 18 | |
국책사업 | 7 | 28.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
민자사업 | 18 | |
국책사업 | 7 | 28.0% |
사업명
Text
UNIQUE
 
Distinct | 25 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 332.0 B |
Value | Count | Frequency (%) |
관광지 | 5 | 9.8% |
관광단지 | 3 | 5.9% |
리조트 | 2 | 3.9% |
골프리조트 | 2 | 3.9% |
제주영어교육도시 | 1 | 2.0% |
밸리 | 1 | 2.0% |
수망관광지구 | 1 | 2.0% |
남원1ㆍ2차 | 1 | 2.0% |
백통신원 | 1 | 2.0% |
우리들메디컬 | 1 | 2.0% |
Other values (33) | 33 |
Most occurring characters
Value | Count | Frequency (%) |
26 | 11.1% | |
지 | 12 | 5.1% |
관 | 11 | 4.7% |
광 | 11 | 4.7% |
리 | 9 | 3.8% |
주 | 6 | 2.6% |
조 | 5 | 2.1% |
트 | 5 | 2.1% |
단 | 5 | 2.1% |
원 | 5 | 2.1% |
Other values (103) | 140 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 203 | |
Space Separator | 26 | 11.1% |
Decimal Number | 2 | 0.9% |
Uppercase Letter | 2 | 0.9% |
Open Punctuation | 1 | 0.4% |
Close Punctuation | 1 | 0.4% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
지 | 12 | 5.9% |
관 | 11 | 5.4% |
광 | 11 | 5.4% |
리 | 9 | 4.4% |
주 | 6 | 3.0% |
조 | 5 | 2.5% |
트 | 5 | 2.5% |
단 | 5 | 2.5% |
원 | 5 | 2.5% |
제 | 5 | 2.5% |
Other values (96) | 129 |
Decimal Number
Value | Count | Frequency (%) |
2 | 1 | |
1 | 1 |
Uppercase Letter
Value | Count | Frequency (%) |
N | 1 | |
H | 1 |
Space Separator
Value | Count | Frequency (%) |
26 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 203 | |
Common | 30 | 12.8% |
Latin | 2 | 0.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
지 | 12 | 5.9% |
관 | 11 | 5.4% |
광 | 11 | 5.4% |
리 | 9 | 4.4% |
주 | 6 | 3.0% |
조 | 5 | 2.5% |
트 | 5 | 2.5% |
단 | 5 | 2.5% |
원 | 5 | 2.5% |
제 | 5 | 2.5% |
Other values (96) | 129 |
Common
Value | Count | Frequency (%) |
26 | ||
( | 1 | 3.3% |
2 | 1 | 3.3% |
1 | 1 | 3.3% |
) | 1 | 3.3% |
Latin
Value | Count | Frequency (%) |
N | 1 | |
H | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 202 | |
ASCII | 32 | 13.6% |
Compat Jamo | 1 | 0.4% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
26 | ||
( | 1 | 3.1% |
2 | 1 | 3.1% |
1 | 1 | 3.1% |
N | 1 | 3.1% |
H | 1 | 3.1% |
) | 1 | 3.1% |
Hangul
Value | Count | Frequency (%) |
지 | 12 | 5.9% |
관 | 11 | 5.4% |
광 | 11 | 5.4% |
리 | 9 | 4.5% |
주 | 6 | 3.0% |
조 | 5 | 2.5% |
트 | 5 | 2.5% |
단 | 5 | 2.5% |
원 | 5 | 2.5% |
제 | 5 | 2.5% |
Other values (95) | 128 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 1 |
위치
Text
Distinct | 24 |
---|---|
Distinct (%) | 96.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 332.0 B |
Value | Count | Frequency (%) |
안덕면 | 5 | 11.9% |
표선면 | 5 | 11.9% |
남원읍 | 3 | 7.1% |
대정읍 | 2 | 4.8% |
성산읍 | 2 | 4.8% |
상천리 | 2 | 4.8% |
세화리 | 1 | 2.4% |
서호동 | 1 | 2.4% |
사계리 | 1 | 2.4% |
상창리 | 1 | 2.4% |
Other values (19) | 19 |
Most occurring characters
Value | Count | Frequency (%) |
17 | 11.0% | |
리 | 17 | 11.0% |
동 | 12 | 7.7% |
면 | 10 | 6.5% |
읍 | 8 | 5.2% |
표 | 6 | 3.9% |
선 | 6 | 3.9% |
덕 | 5 | 3.2% |
안 | 5 | 3.2% |
상 | 5 | 3.2% |
Other values (40) | 64 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 135 | |
Space Separator | 17 | 11.0% |
Math Symbol | 3 | 1.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
리 | 17 | 12.6% |
동 | 12 | 8.9% |
면 | 10 | 7.4% |
읍 | 8 | 5.9% |
표 | 6 | 4.4% |
선 | 6 | 4.4% |
덕 | 5 | 3.7% |
안 | 5 | 3.7% |
상 | 5 | 3.7% |
남 | 4 | 3.0% |
Other values (38) | 57 |
Space Separator
Value | Count | Frequency (%) |
17 |
Math Symbol
Value | Count | Frequency (%) |
+ | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 135 | |
Common | 20 | 12.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
리 | 17 | 12.6% |
동 | 12 | 8.9% |
면 | 10 | 7.4% |
읍 | 8 | 5.9% |
표 | 6 | 4.4% |
선 | 6 | 4.4% |
덕 | 5 | 3.7% |
안 | 5 | 3.7% |
상 | 5 | 3.7% |
남 | 4 | 3.0% |
Other values (38) | 57 |
Common
Value | Count | Frequency (%) |
17 | ||
+ | 3 | 15.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 135 | |
ASCII | 20 | 12.9% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
17 | ||
+ | 3 | 15.0% |
Hangul
Value | Count | Frequency (%) |
리 | 17 | 12.6% |
동 | 12 | 8.9% |
면 | 10 | 7.4% |
읍 | 8 | 5.9% |
표 | 6 | 4.4% |
선 | 6 | 4.4% |
덕 | 5 | 3.7% |
안 | 5 | 3.7% |
상 | 5 | 3.7% |
남 | 4 | 3.0% |
Other values (38) | 57 |
규모(천 제곱미터)
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 25 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1080.52 |
Minimum | 30 |
---|---|
Maximum | 3985 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 357.0 B |
Quantile statistics
Minimum | 30 |
---|---|
5-th percentile | 99.2 |
Q1 | 164 |
median | 549 |
Q3 | 1272 |
95-th percentile | 3746 |
Maximum | 3985 |
Range | 3955 |
Interquartile range (IQR) | 1108 |
Descriptive statistics
Standard deviation | 1251.733 |
---|---|
Coefficient of variation (CV) | 1.1584543 |
Kurtosis | 0.6765676 |
Mean | 1080.52 |
Median Absolute Deviation (MAD) | 417 |
Skewness | 1.3947772 |
Sum | 27013 |
Variance | 1566835.6 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
3792 | 1 | 4.0% |
1135 | 1 | 4.0% |
192 | 1 | 4.0% |
254 | 1 | 4.0% |
1114 | 1 | 4.0% |
146 | 1 | 4.0% |
132 | 1 | 4.0% |
376 | 1 | 4.0% |
108 | 1 | 4.0% |
1272 | 1 | 4.0% |
Other values (15) | 15 |
Value | Count | Frequency (%) |
30 | 1 | |
97 | 1 | |
108 | 1 | |
132 | 1 | |
146 | 1 | |
156 | 1 | |
164 | 1 | |
192 | 1 | |
254 | 1 | |
335 | 1 |
Value | Count | Frequency (%) |
3985 | 1 | |
3792 | 1 | |
3562 | 1 | |
3000 | 1 | |
2394 | 1 | |
1539 | 1 | |
1272 | 1 | |
1135 | 1 | |
1114 | 1 | |
747 | 1 |
사업시작년도
Real number (ℝ)
Distinct | 15 |
---|---|
Distinct (%) | 60.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2004.84 |
Minimum | 1978 |
---|---|
Maximum | 2015 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 357.0 B |
Quantile statistics
Minimum | 1978 |
---|---|
5-th percentile | 1996.2 |
Q1 | 2001 |
median | 2006 |
Q3 | 2008 |
95-th percentile | 2014.6 |
Maximum | 2015 |
Range | 37 |
Interquartile range (IQR) | 7 |
Descriptive statistics
Standard deviation | 7.6685505 |
---|---|
Coefficient of variation (CV) | 0.0038250187 |
Kurtosis | 5.3146152 |
Mean | 2004.84 |
Median Absolute Deviation (MAD) | 3 |
Skewness | -1.7617781 |
Sum | 50121 |
Variance | 58.806667 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2008 | 3 | |
2007 | 3 | |
2005 | 3 | |
2006 | 2 | 8.0% |
2015 | 2 | 8.0% |
2000 | 2 | 8.0% |
2012 | 2 | 8.0% |
1978 | 1 | 4.0% |
2003 | 1 | 4.0% |
1998 | 1 | 4.0% |
Other values (5) | 5 |
Value | Count | Frequency (%) |
1978 | 1 | 4.0% |
1996 | 1 | 4.0% |
1997 | 1 | 4.0% |
1998 | 1 | 4.0% |
2000 | 2 | |
2001 | 1 | 4.0% |
2003 | 1 | 4.0% |
2005 | 3 | |
2006 | 2 | |
2007 | 3 |
Value | Count | Frequency (%) |
2015 | 2 | |
2013 | 1 | 4.0% |
2012 | 2 | |
2009 | 1 | 4.0% |
2008 | 3 | |
2007 | 3 | |
2006 | 2 | |
2005 | 3 | |
2003 | 1 | 4.0% |
2001 | 1 | 4.0% |
사업종료년도
Categorical
Distinct | 5 |
---|---|
Distinct (%) | 20.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 332.0 B |
2018 | |
---|---|
2016 | |
2017 | |
2015 | |
2020 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2016 |
---|---|
2nd row | 2015 |
3rd row | 2018 |
4th row | 2018 |
5th row | 2017 |
Common Values
Value | Count | Frequency (%) |
2018 | 8 | |
2016 | 7 | |
2017 | 5 | |
2015 | 3 | 12.0% |
2020 | 2 | 8.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2018 | 8 | |
2016 | 7 | |
2017 | 5 | |
2015 | 3 | 12.0% |
2020 | 2 | 8.0% |
총사업비(억원)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 24 |
---|---|
Distinct (%) | 96.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 5981.4 |
Minimum | 242 |
---|---|
Maximum | 29111 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 357.0 B |
Quantile statistics
Minimum | 242 |
---|---|
5-th percentile | 436.8 |
Q1 | 1667 |
median | 2736 |
Q3 | 4327 |
95-th percentile | 24129.8 |
Maximum | 29111 |
Range | 28869 |
Interquartile range (IQR) | 2660 |
Descriptive statistics
Standard deviation | 8013.9603 |
---|---|
Coefficient of variation (CV) | 1.3398135 |
Kurtosis | 2.7869914 |
Mean | 5981.4 |
Median Absolute Deviation (MAD) | 1591 |
Skewness | 1.9297896 |
Sum | 149535 |
Variance | 64223559 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2350 | 2 | 8.0% |
2746 | 1 | 4.0% |
599 | 1 | 4.0% |
4327 | 1 | 4.0% |
400 | 1 | 4.0% |
1020 | 1 | 4.0% |
1120 | 1 | 4.0% |
584 | 1 | 4.0% |
1978 | 1 | 4.0% |
2380 | 1 | 4.0% |
Other values (14) | 14 |
Value | Count | Frequency (%) |
242 | 1 | |
400 | 1 | |
584 | 1 | |
599 | 1 | |
1020 | 1 | |
1120 | 1 | |
1667 | 1 | |
1978 | 1 | |
2225 | 1 | |
2350 | 2 |
Value | Count | Frequency (%) |
29111 | 1 | |
25000 | 1 | |
20649 | 1 | |
15214 | 1 | |
10936 | 1 | |
8775 | 1 | |
4327 | 1 | |
3870 | 1 | |
3257 | 1 | |
3060 | 1 |
비고
Categorical
Distinct | 2 |
---|---|
Distinct (%) | 8.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 332.0 B |
관광개발 | |
---|---|
없음 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.68 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 없음 |
---|---|
2nd row | 없음 |
3rd row | 관광개발 |
4th row | 관광개발 |
5th row | 관광개발 |
Common Values
Value | Count | Frequency (%) |
관광개발 | 21 | |
없음 | 4 | 16.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
관광개발 | 21 | |
없음 | 4 | 16.0% |
데이터기준일자
Date
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 4.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 332.0 B |
Minimum | 2023-10-18 00:00:00 |
---|---|
Maximum | 2023-10-18 00:00:00 |
구분 | 사업명 | 위치 | 규모(천 제곱미터) | 사업시작년도 | 사업종료년도 | 총사업비(억원) | 비고 | |
---|---|---|---|---|---|---|---|---|
구분 | 1.000 | 1.000 | 1.000 | 0.807 | 0.549 | 0.000 | 0.887 | 0.418 |
사업명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
위치 | 1.000 | 1.000 | 1.000 | 1.000 | 0.897 | 0.793 | 1.000 | 1.000 |
규모(천 제곱미터) | 0.807 | 1.000 | 1.000 | 1.000 | 0.000 | 0.329 | 0.894 | 0.000 |
사업시작년도 | 0.549 | 1.000 | 0.897 | 0.000 | 1.000 | 0.335 | 0.210 | 0.000 |
사업종료년도 | 0.000 | 1.000 | 0.793 | 0.329 | 0.335 | 1.000 | 0.000 | 0.153 |
총사업비(억원) | 0.887 | 1.000 | 1.000 | 0.894 | 0.210 | 0.000 | 1.000 | 0.000 |
비고 | 0.418 | 1.000 | 1.000 | 0.000 | 0.000 | 0.153 | 0.000 | 1.000 |
구분 | 사업종료년도 | 비고 | |
---|---|---|---|
구분 | 1.000 | 0.000 | 0.272 |
사업종료년도 | 0.000 | 1.000 | 0.154 |
비고 | 0.272 | 0.154 | 1.000 |
규모(천 제곱미터) | 사업시작년도 | 총사업비(억원) | 구분 | 사업종료년도 | 비고 | |
---|---|---|---|---|---|---|
규모(천 제곱미터) | 1.000 | -0.114 | 0.678 | 0.533 | 0.153 | 0.000 |
사업시작년도 | -0.114 | 1.000 | -0.010 | 0.402 | 0.149 | 0.000 |
총사업비(억원) | 0.678 | -0.010 | 1.000 | 0.614 | 0.000 | 0.000 |
구분 | 0.533 | 0.402 | 0.614 | 1.000 | 0.000 | 0.272 |
사업종료년도 | 0.153 | 0.149 | 0.000 | 0.000 | 1.000 | 0.154 |
비고 | 0.000 | 0.000 | 0.000 | 0.272 | 0.154 | 1.000 |
구분 | 사업명 | 위치 | 규모(천 제곱미터) | 사업시작년도 | 사업종료년도 | 총사업비(억원) | 비고 | 데이터기준일자 | |
---|---|---|---|---|---|---|---|---|---|
0 | 국책사업 | 제주영어교육도시 | 대정읍 구억리 | 3792 | 2008 | 2016 | 2746 | 없음 | 2023-10-18 |
1 | 국책사업 | 서귀포 혁신도시 | 서호동 | 1135 | 2007 | 2015 | 2939 | 없음 | 2023-10-18 |
2 | 국책사업 | 제주헬스케어타운 | 동홍동+토평동 | 1539 | 2008 | 2018 | 15214 | 관광개발 | 2023-10-18 |
3 | 국책사업 | 신화역사 공원 | 안덕면 서광리 | 3985 | 2006 | 2018 | 20649 | 관광개발 | 2023-10-18 |
4 | 국책사업 | 예래휴양형주거단지 | 예래동 | 741 | 2005 | 2017 | 25000 | 관광개발 | 2023-10-18 |
5 | 국책사업 | 중문 관광단지 | 색달동+중문동+대포동 | 3562 | 1978 | 2018 | 29111 | 관광개발 | 2023-10-18 |
6 | 국책사업 | 민군복합형 관광미항 | 강정동 | 670 | 2007 | 2017 | 10936 | 없음 | 2023-10-18 |
7 | 민자사업 | 성산포해양 관광단지 | 성산읍 고성리 | 747 | 2003 | 2017 | 3870 | 관광개발 | 2023-10-18 |
8 | 민자사업 | 미천굴 관광지 | 성산읍 삼달리 | 97 | 1998 | 2016 | 242 | 관광개발 | 2023-10-18 |
9 | 민자사업 | 팜파스 종합휴양 관광단지 | 표선면 성읍리 | 3000 | 2008 | 2018 | 8775 | 관광개발 | 2023-10-18 |
구분 | 사업명 | 위치 | 규모(천 제곱미터) | 사업시작년도 | 사업종료년도 | 총사업비(억원) | 비고 | 데이터기준일자 | |
---|---|---|---|---|---|---|---|---|---|
15 | 민자사업 | 남원1ㆍ2차 관광지 | 남원읍 남원리 | 164 | 1996 | 2016 | 1667 | 관광개발 | 2023-10-18 |
16 | 민자사업 | 백통신원 리조트 | 남원읍 위미리 | 549 | 2012 | 2016 | 2350 | 관광개발 | 2023-10-18 |
17 | 민자사업 | 우리들메디컬 골프리조트 | 상효동 | 1272 | 2005 | 2016 | 2350 | 관광개발 | 2023-10-18 |
18 | 민자사업 | 삼매봉 밸리 유원지 개발 | 호근동 | 108 | 2007 | 2017 | 2380 | 관광개발 | 2023-10-18 |
19 | 민자사업 | 제주롯데 리조트 | 색달동 | 376 | 2005 | 2018 | 1978 | 관광개발 | 2023-10-18 |
20 | 민자사업 | 한라힐링파크 | 안덕면 상천리 | 132 | 2009 | 2015 | 584 | 관광개발 | 2023-10-18 |
21 | 민자사업 | 핀크스 비오토피아 휴양리조트 | 안덕면 상천리 | 146 | 2012 | 2018 | 1120 | 관광개발 | 2023-10-18 |
22 | 민자사업 | 테디밸리 골프리조트 | 안덕면 상창리 | 1114 | 2006 | 2015 | 1020 | 관광개발 | 2023-10-18 |
23 | 민자사업 | 용머리 관광지 | 안덕면 사계리 | 254 | 2000 | 2020 | 400 | 관광개발 | 2023-10-18 |
24 | 민자사업 | 뉴오션타운(송악산) | 대정읍 상모리 | 192 | 2015 | 2018 | 4327 | 관광개발 | 2023-10-18 |