Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 5203 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 167.8 KiB |
Average record size in memory | 33.0 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 1 |
Text | 2 |
Dataset
Description | 2023년 9월 15일 기준의 데이터로, 입주관리시스템 기준 연구개발특구의 입주기업 및 기관현황에 대한 데이터입니다.입주기관명과 주소 등의 데이터를 보유하고 있습니다.해당 데이터가 보유한 칼럼은 다음과 같습니다.칼럼명 : 번호, 지역, 기관명, 지구 |
---|---|
Author | (재)연구개발특구진흥재단 |
URL | https://www.data.go.kr/data/15083254/fileData.do |
Reproduction
Analysis started | 2023-12-12 16:50:12.224799 |
---|---|
Analysis finished | 2023-12-12 16:50:13.078983 |
Duration | 0.85 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 5203 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2602 |
Minimum | 1 |
---|---|
Maximum | 5203 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 45.9 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 261.1 |
Q1 | 1301.5 |
median | 2602 |
Q3 | 3902.5 |
95-th percentile | 4942.9 |
Maximum | 5203 |
Range | 5202 |
Interquartile range (IQR) | 2601 |
Descriptive statistics
Standard deviation | 1502.1211 |
---|---|
Coefficient of variation (CV) | 0.57729479 |
Kurtosis | -1.2 |
Mean | 2602 |
Median Absolute Deviation (MAD) | 1301 |
Skewness | 0 |
Sum | 13538206 |
Variance | 2256367.7 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
3458 | 1 | < 0.1% |
3476 | 1 | < 0.1% |
3475 | 1 | < 0.1% |
3474 | 1 | < 0.1% |
3473 | 1 | < 0.1% |
3472 | 1 | < 0.1% |
3471 | 1 | < 0.1% |
3470 | 1 | < 0.1% |
3469 | 1 | < 0.1% |
Other values (5193) | 5193 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
5203 | 1 | |
5202 | 1 | |
5201 | 1 | |
5200 | 1 | |
5199 | 1 | |
5198 | 1 | |
5197 | 1 | |
5196 | 1 | |
5195 | 1 | |
5194 | 1 |
지역
Categorical
HIGH CORRELATION
 
Distinct | 16 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 40.8 KiB |
대덕 | |
---|---|
부산 | |
광주 | |
전북 | |
대구 | |
Other values (11) |
Length
Max length | 10 |
---|---|
Median length | 2 |
Mean length | 2.4378243 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 대덕 |
---|---|
2nd row | 대덕 |
3rd row | 대덕 |
4th row | 대덕 |
5th row | 대덕 |
Common Values
Value | Count | Frequency (%) |
대덕 | 2501 | |
부산 | 880 | 16.9% |
광주 | 676 | 13.0% |
전북 | 479 | 9.2% |
대구 | 288 | 5.5% |
강소(경남김해) | 89 | 1.7% |
강소(경북구미) | 74 | 1.4% |
강소(경북포항) | 71 | 1.4% |
강소(울산울주) | 51 | 1.0% |
강소(충북청주) | 37 | 0.7% |
Other values (6) | 57 | 1.1% |
Length
Value | Count | Frequency (%) |
대덕 | 2501 | |
부산 | 880 | 16.9% |
광주 | 676 | 13.0% |
전북 | 479 | 9.2% |
대구 | 288 | 5.5% |
강소(경남김해 | 89 | 1.7% |
강소(경북구미 | 74 | 1.4% |
강소(경북포항 | 71 | 1.4% |
강소(울산울주 | 51 | 1.0% |
강소(충북청주 | 37 | 0.7% |
Other values (6) | 57 | 1.1% |
기관명
Text
Distinct | 5112 |
---|---|
Distinct (%) | 98.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 40.8 KiB |
Length
Max length | 26 |
---|---|
Median length | 23 |
Mean length | 7.68941 |
Min length | 2 |
Characters and Unicode
Total characters | 40008 |
---|---|
Distinct characters | 728 |
Distinct categories | 11 ? |
Distinct scripts | 4 ? |
Distinct blocks | 5 ? |
Unique
Unique | 5023 ? |
---|---|
Unique (%) | 96.5% |
Sample
1st row | SK이노베이션(주)환경과학기술원 |
---|---|
2nd row | SK에너지(주) |
3rd row | SK바이오팜(주) |
4th row | (주)삼양사 |
5th row | 국립문화재연구소 |
Value | Count | Frequency (%) |
주식회사 | 704 | 11.5% |
유한회사 | 28 | 0.5% |
주 | 21 | 0.3% |
농업회사법인 | 15 | 0.2% |
재단법인 | 5 | 0.1% |
태양광발전소 | 5 | 0.1% |
미음공장 | 4 | 0.1% |
tech | 4 | 0.1% |
기술연구소 | 3 | < 0.1% |
주)삼양사 | 3 | < 0.1% |
Other values (5199) | 5345 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 3670 | 9.2% |
) | 2814 | 7.0% |
( | 2806 | 7.0% |
이 | 1728 | 4.3% |
스 | 1373 | 3.4% |
사 | 1123 | 2.8% |
회 | 1007 | 2.5% |
961 | 2.4% | |
식 | 938 | 2.3% |
에 | 868 | 2.2% |
Other values (718) | 22720 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 32517 | |
Close Punctuation | 2819 | 7.0% |
Open Punctuation | 2811 | 7.0% |
Space Separator | 961 | 2.4% |
Uppercase Letter | 505 | 1.3% |
Lowercase Letter | 221 | 0.6% |
Decimal Number | 72 | 0.2% |
Other Punctuation | 54 | 0.1% |
Other Symbol | 29 | 0.1% |
Dash Punctuation | 17 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 3670 | 11.3% |
이 | 1728 | 5.3% |
스 | 1373 | 4.2% |
사 | 1123 | 3.5% |
회 | 1007 | 3.1% |
식 | 938 | 2.9% |
에 | 868 | 2.7% |
지 | 556 | 1.7% |
아 | 515 | 1.6% |
크 | 495 | 1.5% |
Other values (647) | 20244 |
Uppercase Letter
Value | Count | Frequency (%) |
E | 59 | 11.7% |
S | 55 | 10.9% |
T | 42 | 8.3% |
G | 31 | 6.1% |
N | 30 | 5.9% |
K | 30 | 5.9% |
C | 30 | 5.9% |
I | 29 | 5.7% |
M | 26 | 5.1% |
O | 25 | 5.0% |
Other values (15) | 148 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 33 | |
o | 27 | |
n | 21 | |
t | 17 | 7.7% |
s | 15 | 6.8% |
r | 14 | 6.3% |
i | 14 | 6.3% |
c | 14 | 6.3% |
a | 11 | 5.0% |
l | 8 | 3.6% |
Other values (13) | 47 |
Decimal Number
Value | Count | Frequency (%) |
1 | 19 | |
3 | 12 | |
2 | 10 | |
5 | 9 | |
0 | 7 | 9.7% |
4 | 6 | 8.3% |
9 | 4 | 5.6% |
6 | 3 | 4.2% |
7 | 1 | 1.4% |
8 | 1 | 1.4% |
Other Punctuation
Value | Count | Frequency (%) |
. | 39 | |
& | 8 | 14.8% |
, | 5 | 9.3% |
: | 1 | 1.9% |
/ | 1 | 1.9% |
Close Punctuation
Value | Count | Frequency (%) |
) | 2814 | |
] | 5 | 0.2% |
Open Punctuation
Value | Count | Frequency (%) |
( | 2806 | |
[ | 5 | 0.2% |
Space Separator
Value | Count | Frequency (%) |
961 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 29 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 17 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 32544 | |
Common | 6736 | 16.8% |
Latin | 726 | 1.8% |
Han | 2 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 3670 | 11.3% |
이 | 1728 | 5.3% |
스 | 1373 | 4.2% |
사 | 1123 | 3.5% |
회 | 1007 | 3.1% |
식 | 938 | 2.9% |
에 | 868 | 2.7% |
지 | 556 | 1.7% |
아 | 515 | 1.6% |
크 | 495 | 1.5% |
Other values (646) | 20271 |
Latin
Value | Count | Frequency (%) |
E | 59 | 8.1% |
S | 55 | 7.6% |
T | 42 | 5.8% |
e | 33 | 4.5% |
G | 31 | 4.3% |
N | 30 | 4.1% |
K | 30 | 4.1% |
C | 30 | 4.1% |
I | 29 | 4.0% |
o | 27 | 3.7% |
Other values (38) | 360 |
Common
Value | Count | Frequency (%) |
) | 2814 | |
( | 2806 | |
961 | 14.3% | |
. | 39 | 0.6% |
1 | 19 | 0.3% |
- | 17 | 0.3% |
3 | 12 | 0.2% |
2 | 10 | 0.1% |
5 | 9 | 0.1% |
& | 8 | 0.1% |
Other values (12) | 41 | 0.6% |
Han
Value | Count | Frequency (%) |
星 | 1 | |
雲 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 32514 | |
ASCII | 7462 | 18.7% |
None | 29 | 0.1% |
CJK | 2 | < 0.1% |
Compat Jamo | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 3670 | 11.3% |
이 | 1728 | 5.3% |
스 | 1373 | 4.2% |
사 | 1123 | 3.5% |
회 | 1007 | 3.1% |
식 | 938 | 2.9% |
에 | 868 | 2.7% |
지 | 556 | 1.7% |
아 | 515 | 1.6% |
크 | 495 | 1.5% |
Other values (644) | 20241 |
ASCII
Value | Count | Frequency (%) |
) | 2814 | |
( | 2806 | |
961 | 12.9% | |
E | 59 | 0.8% |
S | 55 | 0.7% |
T | 42 | 0.6% |
. | 39 | 0.5% |
e | 33 | 0.4% |
G | 31 | 0.4% |
N | 30 | 0.4% |
Other values (60) | 592 | 7.9% |
None
Value | Count | Frequency (%) |
㈜ | 29 |
Compat Jamo
Value | Count | Frequency (%) |
ㄹ | 1 |
CJK
Value | Count | Frequency (%) |
星 | 1 | |
雲 | 1 |
지구
Text
Distinct | 53 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 40.8 KiB |
Value | Count | Frequency (%) |
2지구 | 1657 | |
1지구 | 689 | |
1단계 | 672 | |
국제산업 | 559 | 8.4% |
물류도시 | 559 | 8.4% |
진곡지구 | 387 | 5.8% |
나노지구 | 222 | 3.3% |
테크노폴리스지구 | 179 | 2.7% |
첨단과학연구단지 | 154 | 2.3% |
미음일반산업단지 | 144 | 2.2% |
Other values (51) | 1429 |
Most occurring characters
Value | Count | Frequency (%) |
지 | 4360 | 14.3% |
구 | 4019 | 13.2% |
2 | 1660 | 5.4% |
1448 | 4.7% | |
단 | 1422 | 4.7% |
1 | 1391 | 4.6% |
업 | 1047 | 3.4% |
산 | 979 | 3.2% |
( | 672 | 2.2% |
) | 672 | 2.2% |
Other values (93) | 12849 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 23597 | |
Decimal Number | 3206 | 10.5% |
Space Separator | 1448 | 4.7% |
Open Punctuation | 672 | 2.2% |
Close Punctuation | 672 | 2.2% |
Uppercase Letter | 580 | 1.9% |
Other Punctuation | 344 | 1.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
지 | 4360 | |
구 | 4019 | |
단 | 1422 | 6.0% |
업 | 1047 | 4.4% |
산 | 979 | 4.1% |
계 | 672 | 2.8% |
도 | 616 | 2.6% |
국 | 588 | 2.5% |
시 | 585 | 2.5% |
류 | 559 | 2.4% |
Other values (81) | 8750 |
Decimal Number
Value | Count | Frequency (%) |
2 | 1660 | |
1 | 1391 | |
4 | 111 | 3.5% |
3 | 39 | 1.2% |
5 | 5 | 0.2% |
Uppercase Letter
Value | Count | Frequency (%) |
R | 290 | |
D | 290 |
Other Punctuation
Value | Count | Frequency (%) |
& | 290 | |
· | 54 | 15.7% |
Space Separator
Value | Count | Frequency (%) |
1448 |
Open Punctuation
Value | Count | Frequency (%) |
( | 672 |
Close Punctuation
Value | Count | Frequency (%) |
) | 672 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 23597 | |
Common | 6342 | 20.8% |
Latin | 580 | 1.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
지 | 4360 | |
구 | 4019 | |
단 | 1422 | 6.0% |
업 | 1047 | 4.4% |
산 | 979 | 4.1% |
계 | 672 | 2.8% |
도 | 616 | 2.6% |
국 | 588 | 2.5% |
시 | 585 | 2.5% |
류 | 559 | 2.4% |
Other values (81) | 8750 |
Common
Value | Count | Frequency (%) |
2 | 1660 | |
1448 | ||
1 | 1391 | |
( | 672 | |
) | 672 | |
& | 290 | 4.6% |
4 | 111 | 1.8% |
· | 54 | 0.9% |
3 | 39 | 0.6% |
5 | 5 | 0.1% |
Latin
Value | Count | Frequency (%) |
R | 290 | |
D | 290 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 23597 | |
ASCII | 6868 | 22.5% |
None | 54 | 0.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
지 | 4360 | |
구 | 4019 | |
단 | 1422 | 6.0% |
업 | 1047 | 4.4% |
산 | 979 | 4.1% |
계 | 672 | 2.8% |
도 | 616 | 2.6% |
국 | 588 | 2.5% |
시 | 585 | 2.5% |
류 | 559 | 2.4% |
Other values (81) | 8750 |
ASCII
Value | Count | Frequency (%) |
2 | 1660 | |
1448 | ||
1 | 1391 | |
( | 672 | |
) | 672 | |
R | 290 | 4.2% |
D | 290 | 4.2% |
& | 290 | 4.2% |
4 | 111 | 1.6% |
3 | 39 | 0.6% |
None
Value | Count | Frequency (%) |
· | 54 |
번호 | 지역 | 지구 | |
---|---|---|---|
번호 | 1.000 | 0.881 | 0.960 |
지역 | 0.881 | 1.000 | 0.993 |
지구 | 0.960 | 0.993 | 1.000 |
번호 | 지역 | |
---|---|---|
번호 | 1.000 | 0.606 |
지역 | 0.606 | 1.000 |
번호 | 지역 | 기관명 | 지구 | |
---|---|---|---|---|
0 | 1 | 대덕 | SK이노베이션(주)환경과학기술원 | 1지구 |
1 | 2 | 대덕 | SK에너지(주) | 1지구 |
2 | 3 | 대덕 | SK바이오팜(주) | 1지구 |
3 | 4 | 대덕 | (주)삼양사 | 1지구 |
4 | 5 | 대덕 | 국립문화재연구소 | 1지구 |
5 | 6 | 대덕 | 금호폴리켐 | 1지구 |
6 | 7 | 대덕 | (주)윕스 | 1지구 |
7 | 8 | 대덕 | (주)씨앤엘 | 1지구 |
8 | 9 | 대덕 | (주)제우기술 | 1지구 |
9 | 10 | 대덕 | (주)큐니온 | 1지구 |
번호 | 지역 | 기관명 | 지구 | |
---|---|---|---|---|
5193 | 5194 | 강소(충북청주) | (주)서경산업 | 사업화지구 |
5194 | 5195 | 강소(충북청주) | 주식회사 해치텍 | 사업화지구 |
5195 | 5196 | 강소(충북청주) | 주식회사이상기술 | 사업화지구 |
5196 | 5197 | 강소(충북청주) | (주)지오비앤에이치 | 사업화지구 |
5197 | 5198 | 강소(충북청주) | (주)시아이솔루션 | 사업화지구 |
5198 | 5199 | 강소(충북청주) | (재)충북과학기술혁신원 | 사업화지구 |
5199 | 5200 | 강소(충북청주) | (주)유트론 | 사업화지구 |
5200 | 5201 | 강소(충북청주) | 주식회사 큐에스랩 | 사업화지구 |
5201 | 5202 | 강소(충북청주) | (주)네오세미텍 | 사업화지구 |
5202 | 5203 | 강소(충북청주) | 주식회사 딜리셔스마켓 | 사업화지구 |