Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 10000 |
Missing cells | 1265 |
Missing cells (%) | 1.6% |
Duplicate rows | 528 |
Duplicate rows (%) | 5.3% |
Total size in memory | 712.9 KiB |
Average record size in memory | 73.0 B |
Variable types
Categorical | 2 |
---|---|
Text | 5 |
Numeric | 1 |
Dataset
Description | 계약종류,기관명,발주부서명,건명,발주시기,발주(예상)금액(천원),전화번호,사업개요 |
---|---|
Author | 서울특별시 |
URL | https://data.seoul.go.kr/dataList/OA-15616/S/1/datasetView.do |
Dataset has 528 (5.3%) duplicate rows | Duplicates |
발주부서명 has 1264 (12.6%) missing values | Missing |
발주(예상)금액(천원) is highly skewed (γ1 = 82.55924256) | Skewed |
Reproduction
Analysis started | 2024-05-04 04:15:50.160816 |
---|---|
Analysis finished | 2024-05-04 04:15:56.209133 |
Duration | 6.05 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
계약종류
Categorical
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
용역 | |
---|---|
공사 | |
물품 | |
용역 | 3 |
공사 | 2 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0008 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 용역 |
---|---|
2nd row | 공사 |
3rd row | 용역 |
4th row | 용역 |
5th row | 용역 |
Common Values
Value | Count | Frequency (%) |
용역 | 4527 | |
공사 | 3491 | |
물품 | 1977 | |
용역 | 3 | < 0.1% |
공사 | 2 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
용역 | 4530 | |
공사 | 3493 | |
물품 | 1977 |
기관명
Categorical
Distinct | 23 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
투자출연기관 | |
---|---|
서울시(사업소) | |
<NA> | |
성북구 | |
서대문구 | |
Other values (18) |
Length
Max length | 8 |
---|---|
Median length | 7 |
Mean length | 4.7313 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 투자출연기관 |
---|---|
2nd row | 투자출연기관 |
3rd row | <NA> |
4th row | <NA> |
5th row | 투자출연기관 |
Common Values
Value | Count | Frequency (%) |
투자출연기관 | 1655 | |
서울시(사업소) | 1539 | |
<NA> | 1264 | |
성북구 | 894 | |
서대문구 | 884 | |
영등포구 | 865 | |
관악구 | 471 | 4.7% |
서울시(본청) | 410 | 4.1% |
중랑구 | 325 | 3.2% |
은평구 | 256 | 2.6% |
Other values (13) | 1437 |
Length
Value | Count | Frequency (%) |
투자출연기관 | 1655 | |
서울시(사업소 | 1539 | |
na | 1264 | |
성북구 | 894 | |
서대문구 | 884 | |
영등포구 | 865 | |
관악구 | 471 | 4.7% |
서울시(본청 | 410 | 4.1% |
중랑구 | 325 | 3.2% |
은평구 | 256 | 2.6% |
Other values (13) | 1437 |
발주부서명
Text
MISSING
 
Distinct | 326 |
---|---|
Distinct (%) | 3.7% |
Missing | 1264 |
Missing (%) | 12.6% |
Memory size | 156.2 KiB |
Length
Max length | 26 |
---|---|
Median length | 20 |
Mean length | 11.904762 |
Min length | 3 |
Characters and Unicode
Total characters | 104000 |
---|---|
Distinct characters | 234 |
Distinct categories | 4 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 83 ? |
---|---|
Unique (%) | 1.0% |
Sample
1st row | 서울시설관리공단 |
---|---|
2nd row | 서울경제진흥원 |
3rd row | 서울물재생시설공단 |
4th row | 구로구 기획경제국 재무과 |
5th row | 서울시설관리공단 |
Value | Count | Frequency (%) |
재무과 | 5120 | |
기획재정국 | 3809 | |
기획경제국 | 977 | 4.7% |
성북구 | 894 | 4.3% |
서대문구 | 884 | 4.3% |
영등포구 | 866 | 4.2% |
소방행정과 | 479 | 2.3% |
관악구 | 471 | 2.3% |
서울시설관리공단 | 326 | 1.6% |
중랑구 | 325 | 1.6% |
Other values (355) | 6630 |
Most occurring characters
Value | Count | Frequency (%) |
12045 | 11.6% | |
재 | 10032 | 9.6% |
과 | 6653 | 6.4% |
구 | 5510 | 5.3% |
무 | 5336 | 5.1% |
기 | 5242 | 5.0% |
국 | 5173 | 5.0% |
정 | 5059 | 4.9% |
획 | 4997 | 4.8% |
서 | 3929 | 3.8% |
Other values (224) | 40024 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 91599 | |
Space Separator | 12045 | 11.6% |
Decimal Number | 347 | 0.3% |
Uppercase Letter | 9 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
재 | 10032 | 11.0% |
과 | 6653 | 7.3% |
구 | 5510 | 6.0% |
무 | 5336 | 5.8% |
기 | 5242 | 5.7% |
국 | 5173 | 5.6% |
정 | 5059 | 5.5% |
획 | 4997 | 5.5% |
서 | 3929 | 4.3% |
울 | 1993 | 2.2% |
Other values (215) | 37675 |
Decimal Number
Value | Count | Frequency (%) |
0 | 117 | |
5 | 100 | |
1 | 77 | |
2 | 30 | 8.6% |
9 | 23 | 6.6% |
Uppercase Letter
Value | Count | Frequency (%) |
T | 3 | |
B | 3 | |
S | 3 |
Space Separator
Value | Count | Frequency (%) |
12045 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 91599 | |
Common | 12392 | 11.9% |
Latin | 9 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
재 | 10032 | 11.0% |
과 | 6653 | 7.3% |
구 | 5510 | 6.0% |
무 | 5336 | 5.8% |
기 | 5242 | 5.7% |
국 | 5173 | 5.6% |
정 | 5059 | 5.5% |
획 | 4997 | 5.5% |
서 | 3929 | 4.3% |
울 | 1993 | 2.2% |
Other values (215) | 37675 |
Common
Value | Count | Frequency (%) |
12045 | ||
0 | 117 | 0.9% |
5 | 100 | 0.8% |
1 | 77 | 0.6% |
2 | 30 | 0.2% |
9 | 23 | 0.2% |
Latin
Value | Count | Frequency (%) |
T | 3 | |
B | 3 | |
S | 3 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 91599 | |
ASCII | 12401 | 11.9% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
12045 | ||
0 | 117 | 0.9% |
5 | 100 | 0.8% |
1 | 77 | 0.6% |
2 | 30 | 0.2% |
9 | 23 | 0.2% |
T | 3 | < 0.1% |
B | 3 | < 0.1% |
S | 3 | < 0.1% |
Hangul
Value | Count | Frequency (%) |
재 | 10032 | 11.0% |
과 | 6653 | 7.3% |
구 | 5510 | 6.0% |
무 | 5336 | 5.8% |
기 | 5242 | 5.7% |
국 | 5173 | 5.6% |
정 | 5059 | 5.5% |
획 | 4997 | 5.5% |
서 | 3929 | 4.3% |
울 | 1993 | 2.2% |
Other values (215) | 37675 |
건명
Text
Distinct | 9104 |
---|---|
Distinct (%) | 91.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 50 |
---|---|
Median length | 42 |
Mean length | 20.5906 |
Min length | 2 |
Characters and Unicode
Total characters | 205906 |
---|---|
Distinct characters | 876 |
Distinct categories | 16 ? |
Distinct scripts | 4 ? |
Distinct blocks | 8 ? |
Unique
Unique | 8390 ? |
---|---|
Unique (%) | 83.9% |
Sample
1st row | 염곡동서지하차도 저압수전 공사 설계용역 |
---|---|
2nd row | 돈암시장 어닝 설치 |
3rd row | 도시계획시설 입지기준 및 실시계획인가 개선방안 연구 |
4th row | 개발행위허가 기준개선(경사도 등) 및 합리적 관리방안 마련 |
5th row | 체험관 환경조성 및 개선 |
Value | Count | Frequency (%) |
용역 | 1515 | 3.5% |
및 | 1215 | 2.8% |
구매 | 828 | 1.9% |
공사 | 639 | 1.5% |
설치 | 476 | 1.1% |
2023년 | 475 | 1.1% |
2022년 | 463 | 1.1% |
제작 | 393 | 0.9% |
운영 | 363 | 0.8% |
2021년 | 339 | 0.8% |
Other values (12403) | 36350 |
Most occurring characters
Value | Count | Frequency (%) |
33586 | 16.3% | |
2 | 5805 | 2.8% |
사 | 5589 | 2.7% |
공 | 4701 | 2.3% |
용 | 3283 | 1.6% |
역 | 3111 | 1.5% |
설 | 2940 | 1.4% |
구 | 2887 | 1.4% |
0 | 2839 | 1.4% |
시 | 2799 | 1.4% |
Other values (866) | 138366 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 152863 | |
Space Separator | 33587 | 16.3% |
Decimal Number | 12671 | 6.2% |
Uppercase Letter | 1817 | 0.9% |
Open Punctuation | 1799 | 0.9% |
Close Punctuation | 1798 | 0.9% |
Other Punctuation | 640 | 0.3% |
Dash Punctuation | 283 | 0.1% |
Lowercase Letter | 266 | 0.1% |
Math Symbol | 161 | 0.1% |
Other values (6) | 21 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
사 | 5589 | 3.7% |
공 | 4701 | 3.1% |
용 | 3283 | 2.1% |
역 | 3111 | 2.0% |
설 | 2940 | 1.9% |
구 | 2887 | 1.9% |
시 | 2799 | 1.8% |
지 | 2690 | 1.8% |
수 | 2556 | 1.7% |
기 | 2506 | 1.6% |
Other values (768) | 119801 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 300 | |
S | 180 | |
T | 168 | |
V | 139 | 7.6% |
D | 136 | 7.5% |
I | 115 | 6.3% |
E | 100 | 5.5% |
B | 94 | 5.2% |
P | 92 | 5.1% |
L | 76 | 4.2% |
Other values (16) | 417 |
Lowercase Letter
Value | Count | Frequency (%) |
o | 32 | |
e | 29 | 10.9% |
i | 19 | 7.1% |
t | 19 | 7.1% |
s | 18 | 6.8% |
r | 17 | 6.4% |
a | 16 | 6.0% |
n | 15 | 5.6% |
l | 14 | 5.3% |
u | 12 | 4.5% |
Other values (15) | 75 |
Other Punctuation
Value | Count | Frequency (%) |
, | 299 | |
? | 129 | |
. | 69 | 10.8% |
' | 68 | 10.6% |
/ | 29 | 4.5% |
? | 19 | 3.0% |
: | 13 | 2.0% |
& | 7 | 1.1% |
% | 3 | 0.5% |
! | 2 | 0.3% |
Other values (2) | 2 | 0.3% |
Decimal Number
Value | Count | Frequency (%) |
2 | 5805 | |
0 | 2839 | |
1 | 1470 | 11.6% |
3 | 958 | 7.6% |
4 | 593 | 4.7% |
9 | 356 | 2.8% |
5 | 235 | 1.9% |
6 | 167 | 1.3% |
7 | 132 | 1.0% |
8 | 116 | 0.9% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1772 | |
「 | 14 | 0.8% |
[ | 9 | 0.5% |
『 | 3 | 0.2% |
《 | 1 | 0.1% |
Close Punctuation
Value | Count | Frequency (%) |
) | 1770 | |
」 | 14 | 0.8% |
] | 10 | 0.6% |
』 | 3 | 0.2% |
》 | 1 | 0.1% |
Math Symbol
Value | Count | Frequency (%) |
~ | 112 | |
+ | 17 | 10.6% |
> | 16 | 9.9% |
< | 16 | 9.9% |
Space Separator
Value | Count | Frequency (%) |
33586 | ||
1 | < 0.1% |
Final Punctuation
Value | Count | Frequency (%) |
’ | 1 | |
” | 1 |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 1 | |
“ | 1 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 283 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 11 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 2 |
Other Number
Value | Count | Frequency (%) |
¾ | 2 |
Letter Number
Value | Count | Frequency (%) |
Ⅰ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 152850 | |
Common | 50962 | 24.8% |
Latin | 2081 | 1.0% |
Han | 13 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
사 | 5589 | 3.7% |
공 | 4701 | 3.1% |
용 | 3283 | 2.1% |
역 | 3111 | 2.0% |
설 | 2940 | 1.9% |
구 | 2887 | 1.9% |
시 | 2799 | 1.8% |
지 | 2690 | 1.8% |
수 | 2556 | 1.7% |
기 | 2506 | 1.6% |
Other values (764) | 119788 |
Latin
Value | Count | Frequency (%) |
C | 300 | |
S | 180 | 8.6% |
T | 168 | 8.1% |
V | 139 | 6.7% |
D | 136 | 6.5% |
I | 115 | 5.5% |
E | 100 | 4.8% |
B | 94 | 4.5% |
P | 92 | 4.4% |
L | 76 | 3.7% |
Other values (41) | 681 |
Common
Value | Count | Frequency (%) |
33586 | ||
2 | 5805 | 11.4% |
0 | 2839 | 5.6% |
( | 1772 | 3.5% |
) | 1770 | 3.5% |
1 | 1470 | 2.9% |
3 | 958 | 1.9% |
4 | 593 | 1.2% |
9 | 356 | 0.7% |
, | 299 | 0.6% |
Other values (37) | 1514 | 3.0% |
Han
Value | Count | Frequency (%) |
舊 | 10 | |
籍 | 1 | 7.7% |
地 | 1 | 7.7% |
展 | 1 | 7.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 152844 | |
ASCII | 52975 | 25.7% |
None | 58 | < 0.1% |
CJK | 13 | < 0.1% |
Compat Jamo | 6 | < 0.1% |
Letterlike Symbols | 4 | < 0.1% |
Punctuation | 4 | < 0.1% |
Number Forms | 2 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
33586 | ||
2 | 5805 | 11.0% |
0 | 2839 | 5.4% |
( | 1772 | 3.3% |
) | 1770 | 3.3% |
1 | 1470 | 2.8% |
3 | 958 | 1.8% |
4 | 593 | 1.1% |
9 | 356 | 0.7% |
C | 300 | 0.6% |
Other values (73) | 3526 | 6.7% |
Hangul
Value | Count | Frequency (%) |
사 | 5589 | 3.7% |
공 | 4701 | 3.1% |
용 | 3283 | 2.1% |
역 | 3111 | 2.0% |
설 | 2940 | 1.9% |
구 | 2887 | 1.9% |
시 | 2799 | 1.8% |
지 | 2690 | 1.8% |
수 | 2556 | 1.7% |
기 | 2506 | 1.6% |
Other values (763) | 119782 |
None
Value | Count | Frequency (%) |
? | 19 | |
」 | 14 | |
「 | 14 | |
』 | 3 | 5.2% |
『 | 3 | 5.2% |
¾ | 2 | 3.4% |
》 | 1 | 1.7% |
《 | 1 | 1.7% |
1 | 1.7% |
CJK
Value | Count | Frequency (%) |
舊 | 10 | |
籍 | 1 | 7.7% |
地 | 1 | 7.7% |
展 | 1 | 7.7% |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 6 |
Letterlike Symbols
Value | Count | Frequency (%) |
ℓ | 4 |
Number Forms
Value | Count | Frequency (%) |
Ⅰ | 2 |
Punctuation
Value | Count | Frequency (%) |
’ | 1 | |
‘ | 1 | |
“ | 1 | |
” | 1 |
발주시기
Text
Distinct | 128 |
---|---|
Distinct (%) | 1.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 12 |
---|---|
Median length | 12 |
Mean length | 12 |
Min length | 12 |
Characters and Unicode
Total characters | 120000 |
---|---|
Distinct characters | 12 |
Distinct categories | 3 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 27 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | 202210(2022) |
---|---|
2nd row | 202010(2020) |
3rd row | 202005(2020) |
4th row | 202104(2021) |
5th row | 202303(2023) |
Value | Count | Frequency (%) |
202202(2022 | 386 | 3.9% |
202301(2023 | 382 | 3.8% |
202302(2023 | 352 | 3.5% |
202102(2021 | 327 | 3.3% |
202303(2023 | 324 | 3.2% |
202201(2022 | 324 | 3.2% |
202103(2021 | 305 | 3.0% |
202203(2022 | 291 | 2.9% |
202304(2023 | 279 | 2.8% |
202210(2022 | 270 | 2.7% |
Other values (118) | 6760 |
Most occurring characters
Value | Count | Frequency (%) |
2 | 45434 | |
0 | 32095 | |
( | 10000 | 8.3% |
) | 10000 | 8.3% |
1 | 9514 | 7.9% |
3 | 5923 | 4.9% |
4 | 3039 | 2.5% |
9 | 1741 | 1.5% |
7 | 724 | 0.6% |
5 | 672 | 0.6% |
Other values (2) | 858 | 0.7% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 100000 | |
Open Punctuation | 10000 | 8.3% |
Close Punctuation | 10000 | 8.3% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
2 | 45434 | |
0 | 32095 | |
1 | 9514 | 9.5% |
3 | 5923 | 5.9% |
4 | 3039 | 3.0% |
9 | 1741 | 1.7% |
7 | 724 | 0.7% |
5 | 672 | 0.7% |
6 | 456 | 0.5% |
8 | 402 | 0.4% |
Open Punctuation
Value | Count | Frequency (%) |
( | 10000 |
Close Punctuation
Value | Count | Frequency (%) |
) | 10000 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 120000 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
2 | 45434 | |
0 | 32095 | |
( | 10000 | 8.3% |
) | 10000 | 8.3% |
1 | 9514 | 7.9% |
3 | 5923 | 4.9% |
4 | 3039 | 2.5% |
9 | 1741 | 1.5% |
7 | 724 | 0.6% |
5 | 672 | 0.6% |
Other values (2) | 858 | 0.7% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 120000 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2 | 45434 | |
0 | 32095 | |
( | 10000 | 8.3% |
) | 10000 | 8.3% |
1 | 9514 | 7.9% |
3 | 5923 | 4.9% |
4 | 3039 | 2.5% |
9 | 1741 | 1.5% |
7 | 724 | 0.6% |
5 | 672 | 0.6% |
Other values (2) | 858 | 0.7% |
발주(예상)금액(천원)
Real number (ℝ)
SKEWED
 
Distinct | 3595 |
---|---|
Distinct (%) | 35.9% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4284520.9 |
Minimum | 0 |
---|---|
Maximum | 1.2206765 × 1010 |
Zeros | 8 |
Zeros (%) | 0.1% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 4581.4 |
Q1 | 15000 |
median | 42251.5 |
Q3 | 200000 |
95-th percentile | 1660000 |
Maximum | 1.2206765 × 1010 |
Range | 1.2206765 × 1010 |
Interquartile range (IQR) | 185000 |
Descriptive statistics
Standard deviation | 1.3075927 × 108 |
---|---|
Coefficient of variation (CV) | 30.518995 |
Kurtosis | 7601.4408 |
Mean | 4284520.9 |
Median Absolute Deviation (MAD) | 34251.5 |
Skewness | 82.559243 |
Sum | 4.2845209 × 1010 |
Variance | 1.7097987 × 1016 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20000 | 460 | 4.6% |
50000 | 335 | 3.4% |
10000 | 253 | 2.5% |
15000 | 243 | 2.4% |
100000 | 197 | 2.0% |
30000 | 195 | 1.9% |
22000 | 194 | 1.9% |
5000 | 135 | 1.4% |
40000 | 132 | 1.3% |
200000 | 132 | 1.3% |
Other values (3585) | 7724 |
Value | Count | Frequency (%) |
0 | 8 | |
50 | 1 | < 0.1% |
220 | 1 | < 0.1% |
330 | 1 | < 0.1% |
362 | 1 | < 0.1% |
394 | 1 | < 0.1% |
500 | 6 | |
506 | 1 | < 0.1% |
550 | 1 | < 0.1% |
600 | 4 |
Value | Count | Frequency (%) |
12206764900 | 1 | |
1998000000 | 1 | |
1860000000 | 1 | |
1600000000 | 1 | |
1467000000 | 1 | |
1000000000 | 1 | |
923000000 | 1 | |
915000000 | 1 | |
900000000 | 1 | |
800000000 | 2 |
전화번호
Text
Distinct | 5059 |
---|---|
Distinct (%) | 50.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 14 |
---|---|
Median length | 12 |
Mean length | 11.2958 |
Min length | 1 |
Characters and Unicode
Total characters | 112958 |
---|---|
Distinct characters | 39 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 3176 ? |
---|---|
Unique (%) | 31.8% |
Sample
1st row | 02-2290-4695 |
---|---|
2nd row | 2241-3972 |
3rd row | 2133-8408 |
4th row | 02-2133-8421 |
5th row | 02-3660-2148 |
Value | Count | Frequency (%) |
02-2241-4304 | 42 | 0.4% |
02-6981-5221 | 38 | 0.4% |
02-6981-7621 | 30 | 0.3% |
02-330-1963 | 29 | 0.3% |
02-6981-5421 | 25 | 0.2% |
02-2670-3766 | 25 | 0.2% |
02-6913-7721 | 23 | 0.2% |
02-330-1715 | 23 | 0.2% |
02-2670-3432 | 22 | 0.2% |
02-6981-8221 | 22 | 0.2% |
Other values (5047) | 9726 |
Most occurring characters
Value | Count | Frequency (%) |
2 | 20744 | |
- | 18635 | |
0 | 16424 | |
3 | 10419 | |
1 | 8761 | |
6 | 7985 | 7.1% |
4 | 7215 | 6.4% |
7 | 6523 | 5.8% |
5 | 5440 | 4.8% |
8 | 5416 | 4.8% |
Other values (29) | 5396 | 4.8% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 94255 | |
Dash Punctuation | 18635 | 16.5% |
Other Letter | 33 | < 0.1% |
Space Separator | 21 | < 0.1% |
Close Punctuation | 11 | < 0.1% |
Other Punctuation | 3 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
우 | 2 | 6.1% |
이 | 2 | 6.1% |
은 | 2 | 6.1% |
범 | 2 | 6.1% |
박 | 2 | 6.1% |
신 | 2 | 6.1% |
김 | 2 | 6.1% |
예 | 2 | 6.1% |
희 | 1 | 3.0% |
상 | 1 | 3.0% |
Other values (15) | 15 |
Decimal Number
Value | Count | Frequency (%) |
2 | 20744 | |
0 | 16424 | |
3 | 10419 | |
1 | 8761 | |
6 | 7985 | 8.5% |
4 | 7215 | 7.7% |
7 | 6523 | 6.9% |
5 | 5440 | 5.8% |
8 | 5416 | 5.7% |
9 | 5328 | 5.7% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 18635 |
Space Separator
Value | Count | Frequency (%) |
21 |
Close Punctuation
Value | Count | Frequency (%) |
) | 11 |
Other Punctuation
Value | Count | Frequency (%) |
, | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 112925 | |
Hangul | 33 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
우 | 2 | 6.1% |
이 | 2 | 6.1% |
은 | 2 | 6.1% |
범 | 2 | 6.1% |
박 | 2 | 6.1% |
신 | 2 | 6.1% |
김 | 2 | 6.1% |
예 | 2 | 6.1% |
희 | 1 | 3.0% |
상 | 1 | 3.0% |
Other values (15) | 15 |
Common
Value | Count | Frequency (%) |
2 | 20744 | |
- | 18635 | |
0 | 16424 | |
3 | 10419 | |
1 | 8761 | |
6 | 7985 | 7.1% |
4 | 7215 | 6.4% |
7 | 6523 | 5.8% |
5 | 5440 | 4.8% |
8 | 5416 | 4.8% |
Other values (4) | 5363 | 4.7% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 112925 | |
Hangul | 33 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2 | 20744 | |
- | 18635 | |
0 | 16424 | |
3 | 10419 | |
1 | 8761 | |
6 | 7985 | 7.1% |
4 | 7215 | 6.4% |
7 | 6523 | 5.8% |
5 | 5440 | 4.8% |
8 | 5416 | 4.8% |
Other values (4) | 5363 | 4.7% |
Hangul
Value | Count | Frequency (%) |
우 | 2 | 6.1% |
이 | 2 | 6.1% |
은 | 2 | 6.1% |
범 | 2 | 6.1% |
박 | 2 | 6.1% |
신 | 2 | 6.1% |
김 | 2 | 6.1% |
예 | 2 | 6.1% |
희 | 1 | 3.0% |
상 | 1 | 3.0% |
Other values (15) | 15 |
사업개요
Text
Distinct | 8834 |
---|---|
Distinct (%) | 88.3% |
Missing | 1 |
Missing (%) | < 0.1% |
Memory size | 156.2 KiB |
Length
Max length | 100 |
---|---|
Median length | 87 |
Mean length | 24.566357 |
Min length | 1 |
Characters and Unicode
Total characters | 245639 |
---|---|
Distinct characters | 972 |
Distinct categories | 16 ? |
Distinct scripts | 4 ? |
Distinct blocks | 11 ? |
Unique
Unique | 8002 ? |
---|---|
Unique (%) | 80.0% |
Sample
1st row | 설계용역 |
---|---|
2nd row | - 돈암시장 구조물 일부 철거 공사 - 돈암시장 어닝, 막구조물설치 등 |
3rd row | 도시계획시설의 용도지역,지구의에 따른 입지제한 필요성 검토 및 주요 실시계획인가 개선방안 및 업무프로세스 모델 제시 |
4th row | 개발행위허가 기준의 적정성 진단 및 합리적 기준 마련 |
5th row | 체험관 환경조성 및 개선 |
Value | Count | Frequency (%) |
및 | 2468 | 4.4% |
등 | 1296 | 2.3% |
설치 | 744 | 1.3% |
구매 | 708 | 1.3% |
위한 | 644 | 1.1% |
605 | 1.1% | |
용역 | 593 | 1.0% |
정비 | 534 | 0.9% |
공사 | 515 | 0.9% |
교체 | 504 | 0.9% |
Other values (17591) | 47875 |
Most occurring characters
Value | Count | Frequency (%) |
47908 | 19.5% | |
사 | 3659 | 1.5% |
공 | 3360 | 1.4% |
설 | 3352 | 1.4% |
시 | 3328 | 1.4% |
기 | 3030 | 1.2% |
지 | 3018 | 1.2% |
수 | 2874 | 1.2% |
구 | 2706 | 1.1% |
2 | 2697 | 1.1% |
Other values (962) | 169707 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 173489 | |
Space Separator | 47910 | 19.5% |
Decimal Number | 11493 | 4.7% |
Other Punctuation | 4463 | 1.8% |
Uppercase Letter | 2642 | 1.1% |
Close Punctuation | 1367 | 0.6% |
Open Punctuation | 1367 | 0.6% |
Lowercase Letter | 1238 | 0.5% |
Math Symbol | 740 | 0.3% |
Other Symbol | 530 | 0.2% |
Other values (6) | 400 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
사 | 3659 | 2.1% |
공 | 3360 | 1.9% |
설 | 3352 | 1.9% |
시 | 3328 | 1.9% |
기 | 3030 | 1.7% |
지 | 3018 | 1.7% |
수 | 2874 | 1.7% |
구 | 2706 | 1.6% |
및 | 2503 | 1.4% |
보 | 2368 | 1.4% |
Other values (846) | 143291 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 353 | |
L | 322 | |
D | 309 | |
S | 243 | |
T | 194 | 7.3% |
V | 161 | 6.1% |
E | 125 | 4.7% |
P | 121 | 4.6% |
I | 118 | 4.5% |
A | 114 | 4.3% |
Other values (17) | 582 |
Lowercase Letter
Value | Count | Frequency (%) |
m | 713 | |
a | 119 | 9.6% |
o | 72 | 5.8% |
k | 62 | 5.0% |
e | 32 | 2.6% |
n | 31 | 2.5% |
t | 31 | 2.5% |
i | 29 | 2.3% |
s | 25 | 2.0% |
p | 24 | 1.9% |
Other values (13) | 100 | 8.1% |
Other Punctuation
Value | Count | Frequency (%) |
, | 2678 | |
. | 617 | 13.8% |
: | 603 | 13.5% |
? | 166 | 3.7% |
/ | 143 | 3.2% |
' | 93 | 2.1% |
? | 88 | 2.0% |
* | 42 | 0.9% |
@ | 18 | 0.4% |
& | 8 | 0.2% |
Other values (4) | 7 | 0.2% |
Decimal Number
Value | Count | Frequency (%) |
2 | 2697 | |
0 | 2583 | |
1 | 2019 | |
3 | 959 | 8.3% |
4 | 791 | 6.9% |
5 | 749 | 6.5% |
9 | 478 | 4.2% |
6 | 430 | 3.7% |
8 | 404 | 3.5% |
7 | 383 | 3.3% |
Other Symbol
Value | Count | Frequency (%) |
○ | 219 | |
㎡ | 204 | |
㎥ | 38 | 7.2% |
㎜ | 27 | 5.1% |
□ | 24 | 4.5% |
㎞ | 7 | 1.3% |
▣ | 7 | 1.3% |
■ | 2 | 0.4% |
㈜ | 1 | 0.2% |
㎾ | 1 | 0.2% |
Math Symbol
Value | Count | Frequency (%) |
= | 324 | |
~ | 319 | |
× | 32 | 4.3% |
> | 21 | 2.8% |
+ | 18 | 2.4% |
< | 15 | 2.0% |
→ | 11 | 1.5% |
Close Punctuation
Value | Count | Frequency (%) |
) | 1343 | |
] | 10 | 0.7% |
」 | 9 | 0.7% |
』 | 4 | 0.3% |
》 | 1 | 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1343 | |
[ | 10 | 0.7% |
「 | 9 | 0.7% |
『 | 4 | 0.3% |
《 | 1 | 0.1% |
Other Number
Value | Count | Frequency (%) |
² | 4 | |
① | 1 | 14.3% |
② | 1 | 14.3% |
³ | 1 | 14.3% |
Letter Number
Value | Count | Frequency (%) |
Ⅰ | 1 | |
Ⅲ | 1 | |
Ⅱ | 1 |
Space Separator
Value | Count | Frequency (%) |
47908 | ||
2 | < 0.1% |
Final Punctuation
Value | Count | Frequency (%) |
’ | 16 | |
” | 2 | 11.1% |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 7 | |
“ | 2 | 22.2% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 358 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 5 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 173473 | |
Common | 68266 | 27.8% |
Latin | 3889 | 1.6% |
Han | 11 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
사 | 3659 | 2.1% |
공 | 3360 | 1.9% |
설 | 3352 | 1.9% |
시 | 3328 | 1.9% |
기 | 3030 | 1.7% |
지 | 3018 | 1.7% |
수 | 2874 | 1.7% |
구 | 2706 | 1.6% |
및 | 2503 | 1.4% |
보 | 2368 | 1.4% |
Other values (841) | 143275 |
Common
Value | Count | Frequency (%) |
47908 | ||
2 | 2697 | 4.0% |
, | 2678 | 3.9% |
0 | 2583 | 3.8% |
1 | 2019 | 3.0% |
) | 1343 | 2.0% |
( | 1343 | 2.0% |
3 | 959 | 1.4% |
4 | 791 | 1.2% |
5 | 749 | 1.1% |
Other values (52) | 5196 | 7.6% |
Latin
Value | Count | Frequency (%) |
m | 713 | |
C | 353 | 9.1% |
L | 322 | 8.3% |
D | 309 | 7.9% |
S | 243 | 6.2% |
T | 194 | 5.0% |
V | 161 | 4.1% |
E | 125 | 3.2% |
P | 121 | 3.1% |
a | 119 | 3.1% |
Other values (44) | 1229 |
Han
Value | Count | Frequency (%) |
舊 | 3 | |
洞 | 3 | |
前 | 3 | |
市 | 1 | 9.1% |
喪 | 1 | 9.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 173443 | |
ASCII | 71421 | |
CJK Compat | 277 | 0.1% |
Geometric Shapes | 252 | 0.1% |
None | 163 | 0.1% |
Compat Jamo | 29 | < 0.1% |
Punctuation | 27 | < 0.1% |
Arrows | 11 | < 0.1% |
CJK | 11 | < 0.1% |
Number Forms | 3 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
47908 | ||
2 | 2697 | 3.8% |
, | 2678 | 3.7% |
0 | 2583 | 3.6% |
1 | 2019 | 2.8% |
) | 1343 | 1.9% |
( | 1343 | 1.9% |
3 | 959 | 1.3% |
4 | 791 | 1.1% |
5 | 749 | 1.0% |
Other values (74) | 8351 | 11.7% |
Hangul
Value | Count | Frequency (%) |
사 | 3659 | 2.1% |
공 | 3360 | 1.9% |
설 | 3352 | 1.9% |
시 | 3328 | 1.9% |
기 | 3030 | 1.7% |
지 | 3018 | 1.7% |
수 | 2874 | 1.7% |
구 | 2706 | 1.6% |
및 | 2503 | 1.4% |
보 | 2368 | 1.4% |
Other values (837) | 143245 |
Geometric Shapes
Value | Count | Frequency (%) |
○ | 219 | |
□ | 24 | 9.5% |
▣ | 7 | 2.8% |
■ | 2 | 0.8% |
CJK Compat
Value | Count | Frequency (%) |
㎡ | 204 | |
㎥ | 38 | 13.7% |
㎜ | 27 | 9.7% |
㎞ | 7 | 2.5% |
㎾ | 1 | 0.4% |
None
Value | Count | Frequency (%) |
? | 88 | |
× | 32 | 19.6% |
「 | 9 | 5.5% |
」 | 9 | 5.5% |
º | 6 | 3.7% |
² | 4 | 2.5% |
』 | 4 | 2.5% |
『 | 4 | 2.5% |
2 | 1.2% | |
㈜ | 1 | 0.6% |
Other values (4) | 4 | 2.5% |
Compat Jamo
Value | Count | Frequency (%) |
ㅇ | 22 | |
ㆍ | 6 | 20.7% |
ㄹ | 1 | 3.4% |
Punctuation
Value | Count | Frequency (%) |
’ | 16 | |
‘ | 7 | |
“ | 2 | 7.4% |
” | 2 | 7.4% |
Arrows
Value | Count | Frequency (%) |
→ | 11 |
CJK
Value | Count | Frequency (%) |
舊 | 3 | |
洞 | 3 | |
前 | 3 | |
市 | 1 | 9.1% |
喪 | 1 | 9.1% |
Enclosed Alphanum
Value | Count | Frequency (%) |
① | 1 | |
② | 1 |
Number Forms
Value | Count | Frequency (%) |
Ⅰ | 1 | |
Ⅲ | 1 | |
Ⅱ | 1 |
계약종류 | 기관명 | 발주(예상)금액(천원) | |
---|---|---|---|
계약종류 | 1.000 | 0.303 | 0.000 |
기관명 | 0.303 | 1.000 | 0.175 |
발주(예상)금액(천원) | 0.000 | 0.175 | 1.000 |
기관명 | 계약종류 | |
---|---|---|
기관명 | 1.000 | 0.155 |
계약종류 | 0.155 | 1.000 |
발주(예상)금액(천원) | 계약종류 | 기관명 | |
---|---|---|---|
발주(예상)금액(천원) | 1.000 | 0.000 | 0.091 |
계약종류 | 0.000 | 1.000 | 0.155 |
기관명 | 0.091 | 0.155 | 1.000 |
계약종류 | 기관명 | 발주부서명 | 건명 | 발주시기 | 발주(예상)금액(천원) | 전화번호 | 사업개요 | |
---|---|---|---|---|---|---|---|---|
22401 | 용역 | 투자출연기관 | 서울시설관리공단 | 염곡동서지하차도 저압수전 공사 설계용역 | 202210(2022) | 10000 | 02-2290-4695 | 설계용역 |
49442 | 공사 | 투자출연기관 | 서울경제진흥원 | 돈암시장 어닝 설치 | 202010(2020) | 400000 | 2241-3972 | - 돈암시장 구조물 일부 철거 공사 - 돈암시장 어닝, 막구조물설치 등 |
51967 | 용역 | <NA> | <NA> | 도시계획시설 입지기준 및 실시계획인가 개선방안 연구 | 202005(2020) | 200000 | 2133-8408 | 도시계획시설의 용도지역,지구의에 따른 입지제한 필요성 검토 및 주요 실시계획인가 개선방안 및 업무프로세스 모델 제시 |
41181 | 용역 | <NA> | <NA> | 개발행위허가 기준개선(경사도 등) 및 합리적 관리방안 마련 | 202104(2021) | 200000 | 02-2133-8421 | 개발행위허가 기준의 적정성 진단 및 합리적 기준 마련 |
14833 | 용역 | 투자출연기관 | 서울물재생시설공단 | 체험관 환경조성 및 개선 | 202303(2023) | 20000 | 02-3660-2148 | 체험관 환경조성 및 개선 |
13565 | 공사 | 구로구 | 구로구 기획경제국 재무과 | 공원관리팀 기간제근로자 대기실 교체사업 | 202303(2023) | 120000 | 02-860-3084 | 공원 내 노후 기간제근로자 대기실 교체 등 |
26946 | 공사 | <NA> | <NA> | 개나리,반달어린이공원 창의놀이터 조성공사 | 202204(2022) | 400000 | 02-820-1395 | 어린이공원 창의놀이터 조성 |
10324 | 용역 | <NA> | <NA> | 청년 취업박람회(오프라인) | 202305(2023) | 18000 | 02-2148-2254 | 청년 취업박람회 |
57946 | 용역 | 투자출연기관 | 서울시설관리공단 | 개인택시사업자 콜장비 이전설치 | 201912(2019) | 11500 | 02-2290-7232 | 개인택시사업자 콜장비 이전설치 |
15827 | 용역 | 서대문구 | 서대문구 기획재정국 재무과 | 궁동산 등산로 정비사업 실시설계 용역 | 202302(2023) | 12000 | 02-330-1715 | 목재 데크, 목재계단 설치 등 |
계약종류 | 기관명 | 발주부서명 | 건명 | 발주시기 | 발주(예상)금액(천원) | 전화번호 | 사업개요 | |
---|---|---|---|---|---|---|---|---|
36672 | 용역 | <NA> | <NA> | 2022년 수도요금 청구서 등 전산출력 용역 | 202110(2021) | 295533 | 02-3146-1564 | 2022년 수도요금 청구서 전산출력 용역 |
39701 | 공사 | 서울시(사업소) | 용산소방서 소방행정과 | 용산소방서 저녹스 진공온수보일러 교체공사 | 202106(2021) | 32500 | 02-6943-1421 | 용산소방서 저녹스 진공온수보일러 교체공사 |
6183 | 용역 | 성북구 | 성북구 기획재정국 재무과 | 정릉1동어린이집 그린리모델링 공사 감리용역 | 202311(2023) | 4250 | 02-2241-2556 | 그린리모델링으로 에너지소비량 절감 및 쾌적한 보육 환경 조성 |
39463 | 용역 | 투자출연기관 | 서울특별시평생교육진흥원 | 서울시민 평생학습 참여 실태조사 | 202106(2021) | 134000 | 02-719-6431 | 만 25~79세 서울시민 7천명 기준 표본설계 서울시민 대상 가구 방문 시민 대면조사 실시 데이터 분석 및 분석보고서 발간 |
53758 | 용역 | 서울시(사업소) | 남부도로사업소 기전과 | 터널 및 지하차도 비상발전기 정비 | 202004(2020) | 4800 | 3284-5495 | 비상발전기 유지보수 |
43718 | 용역 | 구로구 | 구로구 기획경제국 재무과 | 잣절 유아숲체험원 프로그램 용역 | 202103(2021) | 59000 | 02-860-3147 | 유아숲체험원 프로그램 운영 |
30259 | 용역 | 서울시(사업소) | 119특수구조단 행정지원과 | 2022년 119특수구조단 코로나19 방역소독 용역(1차) | 202202(2022) | 51417 | 02-3706-1916 | 2022년 코로나19대응 청사,소방차량,소방선박 방역 소독 용역 |
29433 | 용역 | 서울시(본청) | 관광체육국 관광산업과 | 서울 관광 M.V.P 테마 코스 확산 | 202203(2022) | 100000 | 02-2133-2786 | 서울관광 M.V.P 코스 활성화 |
25517 | 공사 | 중랑구 | 중랑구 기획재정국 재무과 | 2022년 가로변 녹지량 확충사업 | 202206(2022) | 50000 | 02-2094-2382 | 가로변 유휴공간 녹화 |
38860 | 용역 | 성북구 | 성북구 기획재정국 재무과 | 천장산(청량근린공원) 단절된 산책로 연결사업 실시설계용역 | 202107(2021) | 16000 | 02-2241-3665 | 실시설계용역 |
Most frequently occurring
계약종류 | 기관명 | 발주부서명 | 건명 | 발주시기 | 발주(예상)금액(천원) | 전화번호 | 사업개요 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|
146 | 공사 | 영등포구 | 영등포구 기획재정국 재무과 | 공원 소나무 생육환경 개선사업 | 202303(2023) | 22000 | 02-2670-3761 | 공원 수목 정비 | 5 |
5 | 공사 | 관악구 | 관악구 기획경제국 재무과 | 2022년 배전선로 근접 가로수 가지치기 | 202202(2022) | 221000 | 02-879-6531 | 배전선로 근접 가로수 가지치기 | 4 |
9 | 공사 | 관악구 | 관악구 기획경제국 재무과 | 2022년 주차구획선 시설정비공사 | 202201(2022) | 110000 | 02-879-6902 | 주차구획선 정비공사(연간단가) | 4 |
22 | 공사 | 관악구 | 관악구 기획경제국 재무과 | 노후어린이공원 환경개선 사업(색동) | 202203(2022) | 200000 | 02-879-6504 | 색동어린이공원 환경개선 사업 | 4 |
26 | 공사 | 관악구 | 관악구 기획경제국 재무과 | 봉천,님현 보안등 유지보수공사(연간단가) | 202201(2022) | 450000 | 02-879-6782 | 보안등 유지보수 1식 | 4 |
28 | 공사 | 관악구 | 관악구 기획경제국 재무과 | 봉천초교 보행환경개선사업 | 202203(2022) | 280000 | 02-879-6861 | 보도설치, 미끄럼방지포장 | 4 |
32 | 공사 | 관악구 | 관악구 기획경제국 재무과 | 신림로11길 일대 등 3개소 하수관로 개량공사 | 202201(2022) | 894600 | 02-879-6813 | 하수관로 개량 D450~800㎜, L=710m | 4 |
33 | 공사 | 관악구 | 관악구 기획경제국 재무과 | 신림로73 ~ 137 일대 보도정비 공사 | 202201(2022) | 500000 | 02-879-6771 | 보도 및 보차도경계석, 측구 설치 등 | 4 |
40 | 공사 | 관악구 | 관악구 기획경제국 재무과 | 태양어린이공원 노후시설물 정비 | 202202(2022) | 300000 | 02-879-6504 | 태양어린이공원 노후시설물 정비 공사 | 4 |
46 | 공사 | 광진구 | 광진구 기획경제국 재무과 | 중곡빗물펌프장 관리사택 등 2개소 환경개선 | 202107(2021) | 50000 | 02-450-1628 | 실내건축리모델링 | 4 |