Overview

Dataset statistics

Number of variables4
Number of observations1093
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory35.4 KiB
Average record size in memory33.1 B

Variable types

Numeric1
Text2
Boolean1

Dataset

Description웹을 이용하여 재화나 서비스를 창출하는 국내 웹 관련 기업의 현황 자료이며, 웹 산업 중 웹 개발에 해당하는 기업명 및 기업소개를 확인할 수 있습니다.
Author한국인터넷진흥원
URLhttps://www.data.go.kr/data/15119932/fileData.do

Alerts

사용여부 is highly imbalanced (97.3%)Imbalance
일련번호 has unique valuesUnique

Reproduction

Analysis started2023-12-12 15:57:55.740865
Analysis finished2023-12-12 15:57:56.764672
Duration1.02 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

일련번호
Real number (ℝ)

UNIQUE 

Distinct1093
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean547
Minimum1
Maximum1093
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size9.7 KiB
2023-12-13T00:57:56.849683image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile55.6
Q1274
median547
Q3820
95-th percentile1038.4
Maximum1093
Range1092
Interquartile range (IQR)546

Descriptive statistics

Standard deviation315.66623
Coefficient of variation (CV)0.57708634
Kurtosis-1.2
Mean547
Median Absolute Deviation (MAD)273
Skewness0
Sum597871
Variance99645.167
MonotonicityStrictly increasing
2023-12-13T00:57:57.009433image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
1 1
 
0.1%
728 1
 
0.1%
734 1
 
0.1%
733 1
 
0.1%
732 1
 
0.1%
731 1
 
0.1%
730 1
 
0.1%
729 1
 
0.1%
727 1
 
0.1%
685 1
 
0.1%
Other values (1083) 1083
99.1%
ValueCountFrequency (%)
1 1
0.1%
2 1
0.1%
3 1
0.1%
4 1
0.1%
5 1
0.1%
6 1
0.1%
7 1
0.1%
8 1
0.1%
9 1
0.1%
10 1
0.1%
ValueCountFrequency (%)
1093 1
0.1%
1092 1
0.1%
1091 1
0.1%
1090 1
0.1%
1089 1
0.1%
1088 1
0.1%
1087 1
0.1%
1086 1
0.1%
1085 1
0.1%
1084 1
0.1%
Distinct1092
Distinct (%)99.9%
Missing0
Missing (%)0.0%
Memory size8.7 KiB
2023-12-13T00:57:57.388785image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length17
Median length13
Mean length5.9853614
Min length2

Characters and Unicode

Total characters6542
Distinct characters463
Distinct categories10 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique1091 ?
Unique (%)99.8%

Sample

1st row(주)10억 홈피
2nd row(주)11시11분
3rd row(주)가나미디어그룹
4th row(주)같이커뮤니케이션
5th row(주)거인소프트
ValueCountFrequency (%)
디자인 3
 
0.3%
주)엔텀네트웍스 2
 
0.2%
주식회사 2
 
0.2%
애니빌드 1
 
0.1%
애니웹 1
 
0.1%
애니위즈 1
 
0.1%
앤더블유 1
 
0.1%
애드미션 1
 
0.1%
애드웹 1
 
0.1%
애드웹에이전시 1
 
0.1%
Other values (1104) 1104
98.7%
2023-12-13T00:57:57.995667image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
395
 
6.0%
305
 
4.7%
285
 
4.4%
( 275
 
4.2%
) 275
 
4.2%
185
 
2.8%
182
 
2.8%
164
 
2.5%
158
 
2.4%
139
 
2.1%
Other values (453) 4179
63.9%

Most occurring categories

ValueCountFrequency (%)
Other Letter 5617
85.9%
Open Punctuation 275
 
4.2%
Close Punctuation 275
 
4.2%
Other Symbol 164
 
2.5%
Uppercase Letter 85
 
1.3%
Lowercase Letter 74
 
1.1%
Space Separator 27
 
0.4%
Decimal Number 21
 
0.3%
Other Punctuation 3
 
< 0.1%
Dash Punctuation 1
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
395
 
7.0%
305
 
5.4%
285
 
5.1%
185
 
3.3%
182
 
3.2%
158
 
2.8%
139
 
2.5%
105
 
1.9%
97
 
1.7%
89
 
1.6%
Other values (393) 3677
65.5%
Lowercase Letter
ValueCountFrequency (%)
t 8
 
10.8%
o 7
 
9.5%
i 7
 
9.5%
e 6
 
8.1%
r 5
 
6.8%
n 4
 
5.4%
p 4
 
5.4%
b 3
 
4.1%
w 3
 
4.1%
s 3
 
4.1%
Other values (13) 24
32.4%
Uppercase Letter
ValueCountFrequency (%)
S 13
15.3%
I 9
10.6%
C 9
10.6%
N 7
 
8.2%
D 5
 
5.9%
T 5
 
5.9%
B 5
 
5.9%
E 4
 
4.7%
M 4
 
4.7%
L 4
 
4.7%
Other values (12) 20
23.5%
Decimal Number
ValueCountFrequency (%)
1 9
42.9%
0 3
 
14.3%
2 3
 
14.3%
3 2
 
9.5%
4 1
 
4.8%
8 1
 
4.8%
5 1
 
4.8%
6 1
 
4.8%
Other Punctuation
ValueCountFrequency (%)
. 2
66.7%
& 1
33.3%
Open Punctuation
ValueCountFrequency (%)
( 275
100.0%
Close Punctuation
ValueCountFrequency (%)
) 275
100.0%
Other Symbol
ValueCountFrequency (%)
164
100.0%
Space Separator
ValueCountFrequency (%)
27
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 5781
88.4%
Common 602
 
9.2%
Latin 159
 
2.4%

Most frequent character per script

Hangul
ValueCountFrequency (%)
395
 
6.8%
305
 
5.3%
285
 
4.9%
185
 
3.2%
182
 
3.1%
164
 
2.8%
158
 
2.7%
139
 
2.4%
105
 
1.8%
97
 
1.7%
Other values (394) 3766
65.1%
Latin
ValueCountFrequency (%)
S 13
 
8.2%
I 9
 
5.7%
C 9
 
5.7%
t 8
 
5.0%
o 7
 
4.4%
N 7
 
4.4%
i 7
 
4.4%
e 6
 
3.8%
D 5
 
3.1%
r 5
 
3.1%
Other values (35) 83
52.2%
Common
ValueCountFrequency (%)
( 275
45.7%
) 275
45.7%
27
 
4.5%
1 9
 
1.5%
0 3
 
0.5%
2 3
 
0.5%
. 2
 
0.3%
3 2
 
0.3%
4 1
 
0.2%
& 1
 
0.2%
Other values (4) 4
 
0.7%

Most occurring blocks

ValueCountFrequency (%)
Hangul 5617
85.9%
ASCII 761
 
11.6%
None 164
 
2.5%

Most frequent character per block

Hangul
ValueCountFrequency (%)
395
 
7.0%
305
 
5.4%
285
 
5.1%
185
 
3.3%
182
 
3.2%
158
 
2.8%
139
 
2.5%
105
 
1.9%
97
 
1.7%
89
 
1.6%
Other values (393) 3677
65.5%
ASCII
ValueCountFrequency (%)
( 275
36.1%
) 275
36.1%
27
 
3.5%
S 13
 
1.7%
1 9
 
1.2%
I 9
 
1.2%
C 9
 
1.2%
t 8
 
1.1%
o 7
 
0.9%
N 7
 
0.9%
Other values (49) 122
16.0%
None
ValueCountFrequency (%)
164
100.0%
Distinct1067
Distinct (%)97.6%
Missing0
Missing (%)0.0%
Memory size8.7 KiB
2023-12-13T00:57:58.371630image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length144
Median length95
Mean length45.213175
Min length4

Characters and Unicode

Total characters49418
Distinct characters582
Distinct categories12 ?
Distinct scripts3 ?
Distinct blocks4 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique1045 ?
Unique (%)95.6%

Sample

1st row홈페이지와 쇼핑몰을 구축해주는 기업
2nd row솔루션/SI/ERP/CRM 업종의 소프트웨어 개발, 공급 사업을 하는 주식회사
3rd row웹표준 웹접근성 web site 개발, 3D Animation 제작, App 개발 전문 기업
4th row웹사이트 제작 및 온라인 광고 등을 통해 온오프라인 커뮤니케이션 디자인에 주력하는 기업
5th row홈페이지, 쇼핑몰, 모바일 사이트를 제작 대행해주고, 유지보수와 호스팅까지 해주는 웹사이트 개발 관련 일을 하는 기업
ValueCountFrequency (%)
기업 1007
 
9.7%
제공하는 465
 
4.5%
제작 447
 
4.3%
서비스를 393
 
3.8%
홈페이지 345
 
3.3%
337
 
3.2%
318
 
3.0%
모바일 212
 
2.0%
개발 208
 
2.0%
구축 174
 
1.7%
Other values (2220) 6526
62.6%
2023-12-13T00:57:59.043028image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
9349
 
18.9%
, 2907
 
5.9%
1333
 
2.7%
1308
 
2.6%
1263
 
2.6%
1258
 
2.5%
1253
 
2.5%
1020
 
2.1%
949
 
1.9%
878
 
1.8%
Other values (572) 27900
56.5%

Most occurring categories

ValueCountFrequency (%)
Other Letter 34629
70.1%
Space Separator 9349
 
18.9%
Other Punctuation 3137
 
6.3%
Uppercase Letter 1560
 
3.2%
Lowercase Letter 591
 
1.2%
Decimal Number 51
 
0.1%
Control 42
 
0.1%
Dash Punctuation 40
 
0.1%
Open Punctuation 8
 
< 0.1%
Close Punctuation 8
 
< 0.1%
Other values (2) 3
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
1333
 
3.8%
1308
 
3.8%
1263
 
3.6%
1258
 
3.6%
1253
 
3.6%
1020
 
2.9%
949
 
2.7%
878
 
2.5%
827
 
2.4%
817
 
2.4%
Other values (500) 23723
68.5%
Uppercase Letter
ValueCountFrequency (%)
I 267
17.1%
U 206
13.2%
S 144
9.2%
C 120
 
7.7%
X 92
 
5.9%
D 89
 
5.7%
P 87
 
5.6%
M 82
 
5.3%
T 63
 
4.0%
E 54
 
3.5%
Other values (16) 356
22.8%
Lowercase Letter
ValueCountFrequency (%)
e 95
16.1%
i 61
10.3%
o 56
9.5%
s 53
 
9.0%
n 44
 
7.4%
t 41
 
6.9%
a 28
 
4.7%
r 28
 
4.7%
l 25
 
4.2%
p 22
 
3.7%
Other values (15) 138
23.4%
Decimal Number
ValueCountFrequency (%)
5 18
35.3%
3 13
25.5%
2 6
 
11.8%
0 6
 
11.8%
1 3
 
5.9%
4 2
 
3.9%
7 1
 
2.0%
8 1
 
2.0%
6 1
 
2.0%
Other Punctuation
ValueCountFrequency (%)
, 2907
92.7%
/ 174
 
5.5%
& 38
 
1.2%
. 15
 
0.5%
· 3
 
0.1%
Space Separator
ValueCountFrequency (%)
9349
100.0%
Control
ValueCountFrequency (%)
42
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 40
100.0%
Open Punctuation
ValueCountFrequency (%)
( 8
100.0%
Close Punctuation
ValueCountFrequency (%)
) 8
100.0%
Other Symbol
ValueCountFrequency (%)
2
100.0%
Math Symbol
ValueCountFrequency (%)
+ 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 34631
70.1%
Common 12636
 
25.6%
Latin 2151
 
4.4%

Most frequent character per script

Hangul
ValueCountFrequency (%)
1333
 
3.8%
1308
 
3.8%
1263
 
3.6%
1258
 
3.6%
1253
 
3.6%
1020
 
2.9%
949
 
2.7%
878
 
2.5%
827
 
2.4%
817
 
2.4%
Other values (501) 23725
68.5%
Latin
ValueCountFrequency (%)
I 267
 
12.4%
U 206
 
9.6%
S 144
 
6.7%
C 120
 
5.6%
e 95
 
4.4%
X 92
 
4.3%
D 89
 
4.1%
P 87
 
4.0%
M 82
 
3.8%
T 63
 
2.9%
Other values (41) 906
42.1%
Common
ValueCountFrequency (%)
9349
74.0%
, 2907
 
23.0%
/ 174
 
1.4%
42
 
0.3%
- 40
 
0.3%
& 38
 
0.3%
5 18
 
0.1%
. 15
 
0.1%
3 13
 
0.1%
( 8
 
0.1%
Other values (10) 32
 
0.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 34628
70.1%
ASCII 14784
29.9%
None 5
 
< 0.1%
Compat Jamo 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
9349
63.2%
, 2907
 
19.7%
I 267
 
1.8%
U 206
 
1.4%
/ 174
 
1.2%
S 144
 
1.0%
C 120
 
0.8%
e 95
 
0.6%
X 92
 
0.6%
D 89
 
0.6%
Other values (60) 1341
 
9.1%
Hangul
ValueCountFrequency (%)
1333
 
3.8%
1308
 
3.8%
1263
 
3.6%
1258
 
3.6%
1253
 
3.6%
1020
 
2.9%
949
 
2.7%
878
 
2.5%
827
 
2.4%
817
 
2.4%
Other values (499) 23722
68.5%
None
ValueCountFrequency (%)
· 3
60.0%
2
40.0%
Compat Jamo
ValueCountFrequency (%)
1
100.0%

사용여부
Boolean

IMBALANCE 

Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size1.2 KiB
True
1090 
False
 
3
ValueCountFrequency (%)
True 1090
99.7%
False 3
 
0.3%
2023-12-13T00:57:59.190833image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Interactions

2023-12-13T00:57:56.447235image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-13T00:57:59.263933image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
일련번호사용여부
일련번호1.0000.085
사용여부0.0851.000
2023-12-13T00:57:59.382574image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
일련번호사용여부
일련번호1.0000.065
사용여부0.0651.000

Missing values

2023-12-13T00:57:56.613000image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T00:57:56.717062image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

일련번호기업명기업소개사용여부
01(주)10억 홈피홈페이지와 쇼핑몰을 구축해주는 기업Y
12(주)11시11분솔루션/SI/ERP/CRM 업종의 소프트웨어 개발, 공급 사업을 하는 주식회사Y
23(주)가나미디어그룹웹표준 웹접근성 web site 개발, 3D Animation 제작, App 개발 전문 기업Y
34(주)같이커뮤니케이션웹사이트 제작 및 온라인 광고 등을 통해 온오프라인 커뮤니케이션 디자인에 주력하는 기업Y
45(주)거인소프트홈페이지, 쇼핑몰, 모바일 사이트를 제작 대행해주고, 유지보수와 호스팅까지 해주는 웹사이트 개발 관련 일을 하는 기업Y
56(주)고도소프트고객에게 맞는 쇼핑몰 유형에 따른 쇼핑몰을 제작 판매, 관리하는 기업Y
67(주)골든데이웹사이트 기획 및 제작과 같은 E-Biz, 컨텐츠 제작을 하는 기업Y
78(주)구루브라더스반응형 웹 사이트, 쇼핑몰 & 앱 제작 전문 기업Y
89(주)그라비티인터랙티브UI/UX 디자인 컨설팅, 마케팅, 웹 제작, 모바일 앱 개발과 같은 모바일 어플리케이션 서비스를 제공하는 기업Y
910(주)글로임검색엔진 최적화 서비스 및 웹사이트, 모바일 웹 제작을 제공하는 기업Y
일련번호기업명기업소개사용여부
10831084지란지교소프트 나모에디터 사업부에디터 솔루션 전문기업, 크로스에디터, 액티브스퀘어 등, 기업용 웹편집기 개발Y
10841085토탈소프트API 개발 & 연동, 솔루션 개발 & 유지보수, 반응형웹, 프레임워크, 인트라넷, 비트코인 결제 모듈, 개발사도 의뢰하는 기술 보유 기업Y
10851086(주)아이코어소프트파일 업로드/다운로드 솔루션 제공업체Y
10861087아란타(주)모바일 및 웹 광고 솔루션, 분석 서비스 등을 제공하는 기업Y
10871088(주)유프리즘아이오화상회의, 영상협업 클라우드 서비스 제공Y
10881089(주)코이노PC 및 모바일 원격지원 솔루션 제공업체Y
10891090메이트웨이홈페이지 및 쇼핑몰 제작 웹솔루션 개발 기업N
10901091메이크웨이홈페이지 및 쇼핑몰 제작 웹솔루션 개발 기업Y
10911092이데아텍FIDO 인증 솔루션Y
10921093리커너스반응형홈페이지, 모바일사이트, 모바일앱, 브랜딩, 로고·아이덴티티 제작 및 유지보수 진행, 다양한 인증, 입상 실적과 검증 받은 레퍼런스, 자체 솔루션을 보유한 기술력 있는 기업Y