Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 280 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 4 |
Duplicate rows (%) | 1.4% |
Total size in memory | 7.0 KiB |
Average record size in memory | 25.5 B |
Variable types
Text | 2 |
---|---|
Numeric | 1 |
Dataset
Description | 정보화 사업 추진 현황 |
---|---|
Author | 경기도 |
URL | https://data.gg.go.kr/portal/data/service/selectServicePage.do?&infId=0VWFOCL5FNORSZZK3EB419428060&infSeq=1 |
Dataset has 4 (1.4%) duplicate rows | Duplicates |
Reproduction
Analysis started | 2024-04-11 03:05:23.515519 |
---|---|
Analysis finished | 2024-04-11 03:05:25.058088 |
Duration | 1.54 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
담당부서/공공기관
Text
Distinct | 94 |
---|---|
Distinct (%) | 33.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
Value | Count | Frequency (%) |
경기콘텐츠진흥원 | 16 | 5.7% |
ai빅데이터산업과 | 12 | 4.3% |
정보기획담당관 | 11 | 3.9% |
정보통신보안담당관 | 10 | 3.6% |
경기도일자리재단 | 9 | 3.2% |
경기문화재단 | 8 | 2.9% |
경기도시장상권진흥원 | 8 | 2.9% |
교육지원과 | 8 | 2.9% |
119종합상황실 | 7 | 2.5% |
미세먼지연구부 | 6 | 2.1% |
Other values (84) | 185 |
Most occurring characters
Value | Count | Frequency (%) |
과 | 123 | 6.8% |
기 | 110 | 6.1% |
경 | 89 | 4.9% |
관 | 76 | 4.2% |
정 | 63 | 3.5% |
원 | 57 | 3.2% |
당 | 55 | 3.0% |
담 | 55 | 3.0% |
도 | 48 | 2.7% |
보 | 46 | 2.5% |
Other values (141) | 1084 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1752 | |
Decimal Number | 30 | 1.7% |
Uppercase Letter | 24 | 1.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
과 | 123 | 7.0% |
기 | 110 | 6.3% |
경 | 89 | 5.1% |
관 | 76 | 4.3% |
정 | 63 | 3.6% |
원 | 57 | 3.3% |
당 | 55 | 3.1% |
담 | 55 | 3.1% |
도 | 48 | 2.7% |
보 | 46 | 2.6% |
Other values (137) | 1030 |
Decimal Number
Value | Count | Frequency (%) |
1 | 20 | |
9 | 10 |
Uppercase Letter
Value | Count | Frequency (%) |
I | 12 | |
A | 12 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1752 | |
Common | 30 | 1.7% |
Latin | 24 | 1.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
과 | 123 | 7.0% |
기 | 110 | 6.3% |
경 | 89 | 5.1% |
관 | 76 | 4.3% |
정 | 63 | 3.6% |
원 | 57 | 3.3% |
당 | 55 | 3.1% |
담 | 55 | 3.1% |
도 | 48 | 2.7% |
보 | 46 | 2.6% |
Other values (137) | 1030 |
Common
Value | Count | Frequency (%) |
1 | 20 | |
9 | 10 |
Latin
Value | Count | Frequency (%) |
I | 12 | |
A | 12 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1752 | |
ASCII | 54 | 3.0% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
과 | 123 | 7.0% |
기 | 110 | 6.3% |
경 | 89 | 5.1% |
관 | 76 | 4.3% |
정 | 63 | 3.6% |
원 | 57 | 3.3% |
당 | 55 | 3.1% |
담 | 55 | 3.1% |
도 | 48 | 2.7% |
보 | 46 | 2.6% |
Other values (137) | 1030 |
ASCII
Value | Count | Frequency (%) |
1 | 20 | |
I | 12 | |
A | 12 | |
9 | 10 |
사업명
Text
Distinct | 275 |
---|---|
Distinct (%) | 98.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
Length
Max length | 53 |
---|---|
Median length | 34 |
Mean length | 19.346429 |
Min length | 5 |
Characters and Unicode
Total characters | 5417 |
---|---|
Distinct characters | 373 |
Distinct categories | 11 ? |
Distinct scripts | 3 ? |
Distinct blocks | 5 ? |
Unique
Unique | 270 ? |
---|---|
Unique (%) | 96.4% |
Sample
1st row | 인공지능 리터러시 교육 운영 계획 |
---|---|
2nd row | 인공지능 전문인력 양성 |
3rd row | 지역경제 빅데이터 플랫폼 운영 |
4th row | 경기도 청년지원사업단 운영 |
5th row | 시스템 구축 등 운영비 |
Value | Count | Frequency (%) |
운영 | 84 | 7.6% |
및 | 47 | 4.2% |
유지보수 | 41 | 3.7% |
유지관리 | 40 | 3.6% |
경기도 | 31 | 2.8% |
시스템 | 30 | 2.7% |
2024년 | 26 | 2.3% |
홈페이지 | 20 | 1.8% |
구축 | 18 | 1.6% |
플랫폼 | 17 | 1.5% |
Other values (520) | 753 |
Most occurring characters
Value | Count | Frequency (%) |
830 | 15.3% | |
지 | 201 | 3.7% |
스 | 144 | 2.7% |
시 | 132 | 2.4% |
보 | 130 | 2.4% |
기 | 126 | 2.3% |
리 | 121 | 2.2% |
영 | 118 | 2.2% |
운 | 116 | 2.1% |
관 | 116 | 2.1% |
Other values (363) | 3383 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4125 | |
Space Separator | 830 | 15.3% |
Decimal Number | 177 | 3.3% |
Uppercase Letter | 128 | 2.4% |
Close Punctuation | 56 | 1.0% |
Open Punctuation | 56 | 1.0% |
Other Punctuation | 19 | 0.4% |
Lowercase Letter | 16 | 0.3% |
Dash Punctuation | 5 | 0.1% |
Math Symbol | 4 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
지 | 201 | 4.9% |
스 | 144 | 3.5% |
시 | 132 | 3.2% |
보 | 130 | 3.2% |
기 | 126 | 3.1% |
리 | 121 | 2.9% |
영 | 118 | 2.9% |
운 | 116 | 2.8% |
관 | 116 | 2.8% |
유 | 115 | 2.8% |
Other values (308) | 2806 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 19 | |
D | 13 | 10.2% |
I | 12 | 9.4% |
G | 9 | 7.0% |
R | 8 | 6.2% |
C | 8 | 6.2% |
B | 7 | 5.5% |
A | 7 | 5.5% |
E | 6 | 4.7% |
W | 6 | 4.7% |
Other values (12) | 33 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 3 | |
r | 2 | |
c | 2 | |
o | 2 | |
m | 1 | 6.2% |
d | 1 | 6.2% |
u | 1 | 6.2% |
a | 1 | 6.2% |
n | 1 | 6.2% |
y | 1 | 6.2% |
Decimal Number
Value | Count | Frequency (%) |
2 | 81 | |
4 | 39 | |
0 | 38 | |
1 | 9 | 5.1% |
5 | 3 | 1.7% |
3 | 3 | 1.7% |
9 | 2 | 1.1% |
6 | 1 | 0.6% |
7 | 1 | 0.6% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 5 | |
, | 5 | |
' | 4 | |
· | 3 | |
′ | 1 | 5.3% |
& | 1 | 5.3% |
Math Symbol
Value | Count | Frequency (%) |
~ | 3 | |
∼ | 1 | 25.0% |
Space Separator
Value | Count | Frequency (%) |
830 |
Close Punctuation
Value | Count | Frequency (%) |
) | 56 |
Open Punctuation
Value | Count | Frequency (%) |
( | 56 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 5 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4125 | |
Common | 1148 | 21.2% |
Latin | 144 | 2.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
지 | 201 | 4.9% |
스 | 144 | 3.5% |
시 | 132 | 3.2% |
보 | 130 | 3.2% |
기 | 126 | 3.1% |
리 | 121 | 2.9% |
영 | 118 | 2.9% |
운 | 116 | 2.8% |
관 | 116 | 2.8% |
유 | 115 | 2.8% |
Other values (308) | 2806 |
Latin
Value | Count | Frequency (%) |
S | 19 | 13.2% |
D | 13 | 9.0% |
I | 12 | 8.3% |
G | 9 | 6.2% |
R | 8 | 5.6% |
C | 8 | 5.6% |
B | 7 | 4.9% |
A | 7 | 4.9% |
E | 6 | 4.2% |
W | 6 | 4.2% |
Other values (23) | 49 |
Common
Value | Count | Frequency (%) |
830 | ||
2 | 81 | 7.1% |
) | 56 | 4.9% |
( | 56 | 4.9% |
4 | 39 | 3.4% |
0 | 38 | 3.3% |
1 | 9 | 0.8% |
- | 5 | 0.4% |
/ | 5 | 0.4% |
, | 5 | 0.4% |
Other values (12) | 24 | 2.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4125 | |
ASCII | 1286 | 23.7% |
None | 3 | 0.1% |
Punctuation | 2 | < 0.1% |
Math Operators | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
830 | ||
2 | 81 | 6.3% |
) | 56 | 4.4% |
( | 56 | 4.4% |
4 | 39 | 3.0% |
0 | 38 | 3.0% |
S | 19 | 1.5% |
D | 13 | 1.0% |
I | 12 | 0.9% |
G | 9 | 0.7% |
Other values (41) | 133 | 10.3% |
Hangul
Value | Count | Frequency (%) |
지 | 201 | 4.9% |
스 | 144 | 3.5% |
시 | 132 | 3.2% |
보 | 130 | 3.2% |
기 | 126 | 3.1% |
리 | 121 | 2.9% |
영 | 118 | 2.9% |
운 | 116 | 2.8% |
관 | 116 | 2.8% |
유 | 115 | 2.8% |
Other values (308) | 2806 |
None
Value | Count | Frequency (%) |
· | 3 |
Punctuation
Value | Count | Frequency (%) |
′ | 1 | |
’ | 1 |
Math Operators
Value | Count | Frequency (%) |
∼ | 1 |
사업비(천원)
Real number (ℝ)
Distinct | 232 |
---|---|
Distinct (%) | 82.9% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 394223.87 |
Minimum | 1494 |
---|---|
Maximum | 20174091 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.6 KiB |
Quantile statistics
Minimum | 1494 |
---|---|
5-th percentile | 7498.5 |
Q1 | 32370.75 |
median | 92442.5 |
Q3 | 307120.25 |
95-th percentile | 1603538.9 |
Maximum | 20174091 |
Range | 20172597 |
Interquartile range (IQR) | 274749.5 |
Descriptive statistics
Standard deviation | 1371624.1 |
---|---|
Coefficient of variation (CV) | 3.4793025 |
Kurtosis | 157.78412 |
Mean | 394223.87 |
Median Absolute Deviation (MAD) | 77178.5 |
Skewness | 11.454446 |
Sum | 1.1038268 × 108 |
Variance | 1.8813527 × 1012 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
50000 | 8 | 2.9% |
35000 | 5 | 1.8% |
40000 | 5 | 1.8% |
45000 | 4 | 1.4% |
20000 | 3 | 1.1% |
30000 | 3 | 1.1% |
19000 | 3 | 1.1% |
60000 | 3 | 1.1% |
150000 | 3 | 1.1% |
38000 | 3 | 1.1% |
Other values (222) | 240 |
Value | Count | Frequency (%) |
1494 | 1 | |
1800 | 1 | |
2310 | 1 | |
3916 | 1 | |
4020 | 2 | |
4200 | 1 | |
5000 | 1 | |
5130 | 1 | |
5600 | 1 | |
5859 | 1 |
Value | Count | Frequency (%) |
20174091 | 1 | |
6950918 | 1 | |
3930529 | 1 | |
3841451 | 1 | |
3592000 | 1 | |
2794184 | 1 | |
2790000 | 1 | |
2096554 | 1 | |
2065000 | 1 | |
1861944 | 1 |
담당부서/공공기관 | 사업비(천원) | |
---|---|---|
담당부서/공공기관 | 1.000 | 0.000 |
사업비(천원) | 0.000 | 1.000 |
담당부서/공공기관 | 사업명 | 사업비(천원) | |
---|---|---|---|
0 | AI빅데이터산업과 | 인공지능 리터러시 교육 운영 계획 | 750000 |
1 | AI빅데이터산업과 | 인공지능 전문인력 양성 | 300000 |
2 | AI빅데이터산업과 | 지역경제 빅데이터 플랫폼 운영 | 500000 |
3 | 청년기회과 | 경기도 청년지원사업단 운영 | 131000 |
4 | 청년기회과 | 시스템 구축 등 운영비 | 361205 |
5 | 청년기회과 | 청년 면접수당 | 50000 |
6 | 청년기회과 | 청년노동자 통장 운영 | 625000 |
7 | 교육지원과 | 교육관리시스템 기능보강(교육관리시스템 기능보강) | 40000 |
8 | 교육지원과 | 교육관리시스템 유지관리 및 학습지원센터 운영(이러닝 운영 및 콘텐츠 제작임차) | 767000 |
9 | 교육지원과 | 도서관 자동화(RFID)장비 유지관리 | 4020 |
담당부서/공공기관 | 사업명 | 사업비(천원) | |
---|---|---|---|
270 | 벤처스타트업과 | 경기 스타트업 플랫폼 운영 | 380000 |
271 | AI빅데이터산업과 | AI기반 맞춤형 돌봄 서비스 실증 확대 | 650000 |
272 | AI빅데이터산업과 | 경기 생성형 AI 데이터 플랫폼 구축 컨설팅 | 405000 |
273 | AI빅데이터산업과 | 경기도 인공지능 교육센터 구축 | 450000 |
274 | AI빅데이터산업과 | 공공데이터 개방 및 품질관리 | 500000 |
275 | AI빅데이터산업과 | 데이터 분석 | 540000 |
276 | AI빅데이터산업과 | 데이터 분석시스템 운영 및 유지보수 | 433000 |
277 | AI빅데이터산업과 | 마이데이터 통합 플랫폼 운영 | 935000 |
278 | AI빅데이터산업과 | 발달장애인 AI Care 사업 | 200000 |
279 | AI빅데이터산업과 | 분석용 민간데이터 구매 | 800000 |
Most frequently occurring
담당부서/공공기관 | 사업명 | 사업비(천원) | # duplicates | |
---|---|---|---|---|
0 | 교육지원과 | 교육관리시스템 기능보강(교육관리시스템 기능보강) | 40000 | 2 |
1 | 교육지원과 | 교육관리시스템 유지관리 및 학습지원센터 운영(이러닝 운영 및 콘텐츠 제작임차) | 767000 | 2 |
2 | 교육지원과 | 도서관 자동화(RFID)장비 유지관리 | 4020 | 2 |
3 | 교육지원과 | 전산교육장비 유지관리(전산교육장비 유지관리) | 50000 | 2 |