Overview

Dataset statistics

Number of variables10
Number of observations29
Missing cells41
Missing cells (%)14.1%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory2.5 KiB
Average record size in memory87.6 B

Variable types

Text5
Categorical3
Numeric2

Dataset

Description샘플 데이터
Author한국평가데이터㈜
URLhttps://www.bigdata-region.kr/#/dataset/bfa10796-5846-42f4-b6f5-696129e896ee

Alerts

수정일시분초 has constant value ""Constant
작업자명 has constant value ""Constant
표준산업분류코드 is highly overall correlated with 계층구분코드High correlation
유럽표준산업분류코드 is highly overall correlated with 계층구분코드High correlation
계층구분코드 is highly overall correlated with 표준산업분류코드 and 1 other fieldsHigh correlation
업종상세내용 has 5 (17.2%) missing valuesMissing
예외대상업종내용 has 18 (62.1%) missing valuesMissing
표준산업분류코드 has 9 (31.0%) missing valuesMissing
유럽표준산업분류코드 has 9 (31.0%) missing valuesMissing
업종코드 has unique valuesUnique

Reproduction

Analysis started2023-12-10 14:16:04.733469
Analysis finished2023-12-10 14:16:06.900345
Duration2.17 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

업종코드
Text

UNIQUE 

Distinct29
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size364.0 B
2023-12-10T23:16:07.200079image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length6
Median length6
Mean length5.5172414
Min length3

Characters and Unicode

Total characters160
Distinct characters10
Distinct categories2 ?
Distinct scripts2 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique29 ?
Unique (%)100.0%

Sample

1st rowG46311
2nd rowG46312
3rd rowG46313
4th rowG46314
5th rowG46315
ValueCountFrequency (%)
g46311 1
 
3.4%
g46331 1
 
3.4%
c33209 1
 
3.4%
c33202 1
 
3.4%
c33201 1
 
3.4%
c3320 1
 
3.4%
c332 1
 
3.4%
c33120 1
 
3.4%
c3312 1
 
3.4%
c33110 1
 
3.4%
Other values (19) 19
65.5%
2023-12-10T23:16:08.242036image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
3 47
29.4%
4 19
11.9%
2 19
11.9%
6 18
 
11.2%
G 17
 
10.6%
1 17
 
10.6%
C 12
 
7.5%
0 6
 
3.8%
9 3
 
1.9%
5 2
 
1.2%

Most occurring categories

ValueCountFrequency (%)
Decimal Number 131
81.9%
Uppercase Letter 29
 
18.1%

Most frequent character per category

Decimal Number
ValueCountFrequency (%)
3 47
35.9%
4 19
14.5%
2 19
14.5%
6 18
 
13.7%
1 17
 
13.0%
0 6
 
4.6%
9 3
 
2.3%
5 2
 
1.5%
Uppercase Letter
ValueCountFrequency (%)
G 17
58.6%
C 12
41.4%

Most occurring scripts

ValueCountFrequency (%)
Common 131
81.9%
Latin 29
 
18.1%

Most frequent character per script

Common
ValueCountFrequency (%)
3 47
35.9%
4 19
14.5%
2 19
14.5%
6 18
 
13.7%
1 17
 
13.0%
0 6
 
4.6%
9 3
 
2.3%
5 2
 
1.5%
Latin
ValueCountFrequency (%)
G 17
58.6%
C 12
41.4%

Most occurring blocks

ValueCountFrequency (%)
ASCII 160
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
3 47
29.4%
4 19
11.9%
2 19
11.9%
6 18
 
11.2%
G 17
 
10.6%
1 17
 
10.6%
C 12
 
7.5%
0 6
 
3.8%
9 3
 
1.9%
5 2
 
1.2%

계층구분코드
Categorical

HIGH CORRELATION 

Distinct4
Distinct (%)13.8%
Missing0
Missing (%)0.0%
Memory size364.0 B
5
20 
4
3
2
 
1

Length

Max length1
Median length1
Mean length1
Min length1

Unique

Unique1 ?
Unique (%)3.4%

Sample

1st row5
2nd row5
3rd row5
4th row5
5th row5

Common Values

ValueCountFrequency (%)
5 20
69.0%
4 5
 
17.2%
3 3
 
10.3%
2 1
 
3.4%

Length

2023-12-10T23:16:08.513205image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-10T23:16:08.740963image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
5 20
69.0%
4 5
 
17.2%
3 3
 
10.3%
2 1
 
3.4%
Distinct26
Distinct (%)89.7%
Missing0
Missing (%)0.0%
Memory size364.0 B
2023-12-10T23:16:09.090069image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length21
Median length18
Mean length12.172414
Min length6

Characters and Unicode

Total characters353
Distinct characters75
Distinct categories3 ?
Distinct scripts2 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique23 ?
Unique (%)79.3%

Sample

1st row과실류 도매업
2nd row채소류; 서류 및 향신작물류 도매업
3rd row육류 도매업
4th row건어물 및 젓갈류 도매업
5th row신선; 냉동 및 기타 수산물 도매업
ValueCountFrequency (%)
도매업 17
16.3%
13
 
12.5%
제조업 12
 
11.5%
가공식품 5
 
4.8%
기타 5
 
4.8%
악기 5
 
4.8%
귀금속 5
 
4.8%
모조 4
 
3.8%
장신용품 3
 
2.9%
육류 2
 
1.9%
Other values (31) 33
31.7%
2023-12-10T23:16:09.793805image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
75
21.2%
29
 
8.2%
17
 
4.8%
17
 
4.8%
17
 
4.8%
15
 
4.2%
13
 
3.7%
13
 
3.7%
12
 
3.4%
11
 
3.1%
Other values (65) 134
38.0%

Most occurring categories

ValueCountFrequency (%)
Other Letter 272
77.1%
Space Separator 75
 
21.2%
Other Punctuation 6
 
1.7%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
29
 
10.7%
17
 
6.2%
17
 
6.2%
17
 
6.2%
15
 
5.5%
13
 
4.8%
13
 
4.8%
12
 
4.4%
11
 
4.0%
7
 
2.6%
Other values (62) 121
44.5%
Other Punctuation
ValueCountFrequency (%)
; 5
83.3%
· 1
 
16.7%
Space Separator
ValueCountFrequency (%)
75
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 272
77.1%
Common 81
 
22.9%

Most frequent character per script

Hangul
ValueCountFrequency (%)
29
 
10.7%
17
 
6.2%
17
 
6.2%
17
 
6.2%
15
 
5.5%
13
 
4.8%
13
 
4.8%
12
 
4.4%
11
 
4.0%
7
 
2.6%
Other values (62) 121
44.5%
Common
ValueCountFrequency (%)
75
92.6%
; 5
 
6.2%
· 1
 
1.2%

Most occurring blocks

ValueCountFrequency (%)
Hangul 272
77.1%
ASCII 80
 
22.7%
None 1
 
0.3%

Most frequent character per block

ASCII
ValueCountFrequency (%)
75
93.8%
; 5
 
6.2%
Hangul
ValueCountFrequency (%)
29
 
10.7%
17
 
6.2%
17
 
6.2%
17
 
6.2%
15
 
5.5%
13
 
4.8%
13
 
4.8%
12
 
4.4%
11
 
4.0%
7
 
2.6%
Other values (62) 121
44.5%
None
ValueCountFrequency (%)
· 1
100.0%
Distinct26
Distinct (%)89.7%
Missing0
Missing (%)0.0%
Memory size364.0 B
2023-12-10T23:16:10.125163image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length70
Median length52
Mean length40.827586
Min length17

Characters and Unicode

Total characters1184
Distinct characters30
Distinct categories5 ?
Distinct scripts2 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique23 ?
Unique (%)79.3%

Sample

1st rowWholesale of fruit
2nd rowWholesale of vegetables; root and tube crops and spice crops
3rd rowWholesale of meat
4th rowWholesale of dried and salted fishery products
5th rowWholesale of fresh; frozen and other fishery products
ValueCountFrequency (%)
of 28
16.9%
and 18
 
10.8%
wholesale 17
 
10.2%
manufacture 11
 
6.6%
food 7
 
4.2%
jewellery 7
 
4.2%
instruments 5
 
3.0%
other 5
 
3.0%
products 5
 
3.0%
processed 4
 
2.4%
Other values (41) 59
35.5%
2023-12-10T23:16:10.692321image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
e 139
11.7%
137
11.6%
o 103
 
8.7%
a 90
 
7.6%
l 70
 
5.9%
s 70
 
5.9%
r 69
 
5.8%
t 64
 
5.4%
f 60
 
5.1%
n 52
 
4.4%
Other values (20) 330
27.9%

Most occurring categories

ValueCountFrequency (%)
Lowercase Letter 1011
85.4%
Space Separator 137
 
11.6%
Uppercase Letter 29
 
2.4%
Other Punctuation 6
 
0.5%
Dash Punctuation 1
 
0.1%

Most frequent character per category

Lowercase Letter
ValueCountFrequency (%)
e 139
13.7%
o 103
10.2%
a 90
 
8.9%
l 70
 
6.9%
s 70
 
6.9%
r 69
 
6.8%
t 64
 
6.3%
f 60
 
5.9%
n 52
 
5.1%
d 50
 
4.9%
Other values (14) 244
24.1%
Uppercase Letter
ValueCountFrequency (%)
W 17
58.6%
M 11
37.9%
O 1
 
3.4%
Space Separator
ValueCountFrequency (%)
137
100.0%
Other Punctuation
ValueCountFrequency (%)
; 6
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Latin 1040
87.8%
Common 144
 
12.2%

Most frequent character per script

Latin
ValueCountFrequency (%)
e 139
13.4%
o 103
 
9.9%
a 90
 
8.7%
l 70
 
6.7%
s 70
 
6.7%
r 69
 
6.6%
t 64
 
6.2%
f 60
 
5.8%
n 52
 
5.0%
d 50
 
4.8%
Other values (17) 273
26.2%
Common
ValueCountFrequency (%)
137
95.1%
; 6
 
4.2%
- 1
 
0.7%

Most occurring blocks

ValueCountFrequency (%)
ASCII 1184
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
e 139
11.7%
137
11.6%
o 103
 
8.7%
a 90
 
7.6%
l 70
 
5.9%
s 70
 
5.9%
r 69
 
5.8%
t 64
 
5.4%
f 60
 
5.1%
n 52
 
4.4%
Other values (20) 330
27.9%

업종상세내용
Text

MISSING 

Distinct24
Distinct (%)100.0%
Missing5
Missing (%)17.2%
Memory size364.0 B
2023-12-10T23:16:11.135208image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length267
Median length111
Mean length117.83333
Min length33

Characters and Unicode

Total characters2828
Distinct characters277
Distinct categories6 ?
Distinct scripts2 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique24 ?
Unique (%)100.0%

Sample

1st row견과를 포함한 각종 과실류를 도매하는 산업활동을 말한다. <예 시> ·견과류(대추; 밤; 은행 등) 도매 ·사과; 배; 감; 포도 등 과일 도매
2nd row각종 채소류; 서류 및 향신작물류를 도매하는 산업활동을 말한다. <예 시> ·채소(각종 나물) 도매 ·고구마; 감자 도매 ·마늘; 도라지; 오이; 호박 도매
3rd row가축 및 기타 육지동물의 신선·냉장·냉동한 도축고기를 도매하는 산업활동을 말한다. <예 시> ·우육 및 돈육 도매 ·가금육 도매 ·기타 조류 고기 도매 ·냉장육 도매
4th row각종 해산물 및 민물고기 등을 건조; 염장한 수산물을 도매하는 산업활동을 말한다. <예 시> ·건어물 도매 ·(조미하지 않은) 젓갈류 도매
5th row각종 해산물 및 민물고기 등의 살아있는 것; 신선한 것; 냉동 및 기타 단순 가공한 수산물을 도매하는 산업활동을 말한다. <예 시> ·신선 어류 도매 ·신선 해조류 도매 ·냉동 어개류(어류; 게; 새우 등) 도매
ValueCountFrequency (%)
도매 69
 
9.7%
44
 
6.2%
제조 36
 
5.0%
산업활동을 25
 
3.5%
말한다 22
 
3.1%
20
 
2.8%
20
 
2.8%
도매하는 18
 
2.5%
기타 12
 
1.7%
제조하는 9
 
1.3%
Other values (322) 439
61.5%
2023-12-10T23:16:11.806262image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
730
25.8%
· 118
 
4.2%
96
 
3.4%
88
 
3.1%
71
 
2.5%
; 65
 
2.3%
64
 
2.3%
47
 
1.7%
46
 
1.6%
44
 
1.6%
Other values (267) 1459
51.6%

Most occurring categories

ValueCountFrequency (%)
Other Letter 1823
64.5%
Space Separator 730
25.8%
Other Punctuation 211
 
7.5%
Math Symbol 40
 
1.4%
Open Punctuation 12
 
0.4%
Close Punctuation 12
 
0.4%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
96
 
5.3%
88
 
4.8%
71
 
3.9%
64
 
3.5%
47
 
2.6%
46
 
2.5%
44
 
2.4%
40
 
2.2%
39
 
2.1%
39
 
2.1%
Other values (259) 1249
68.5%
Other Punctuation
ValueCountFrequency (%)
· 118
55.9%
; 65
30.8%
. 28
 
13.3%
Math Symbol
ValueCountFrequency (%)
> 20
50.0%
< 20
50.0%
Space Separator
ValueCountFrequency (%)
730
100.0%
Open Punctuation
ValueCountFrequency (%)
( 12
100.0%
Close Punctuation
ValueCountFrequency (%)
) 12
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 1823
64.5%
Common 1005
35.5%

Most frequent character per script

Hangul
ValueCountFrequency (%)
96
 
5.3%
88
 
4.8%
71
 
3.9%
64
 
3.5%
47
 
2.6%
46
 
2.5%
44
 
2.4%
40
 
2.2%
39
 
2.1%
39
 
2.1%
Other values (259) 1249
68.5%
Common
ValueCountFrequency (%)
730
72.6%
· 118
 
11.7%
; 65
 
6.5%
. 28
 
2.8%
> 20
 
2.0%
< 20
 
2.0%
( 12
 
1.2%
) 12
 
1.2%

Most occurring blocks

ValueCountFrequency (%)
Hangul 1823
64.5%
ASCII 887
31.4%
None 118
 
4.2%

Most frequent character per block

ASCII
ValueCountFrequency (%)
730
82.3%
; 65
 
7.3%
. 28
 
3.2%
> 20
 
2.3%
< 20
 
2.3%
( 12
 
1.4%
) 12
 
1.4%
None
ValueCountFrequency (%)
· 118
100.0%
Hangul
ValueCountFrequency (%)
96
 
5.3%
88
 
4.8%
71
 
3.9%
64
 
3.5%
47
 
2.6%
46
 
2.5%
44
 
2.4%
40
 
2.2%
39
 
2.1%
39
 
2.1%
Other values (259) 1249
68.5%
Distinct11
Distinct (%)100.0%
Missing18
Missing (%)62.1%
Memory size364.0 B
2023-12-10T23:16:12.286420image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length123
Median length63
Mean length60.636364
Min length24

Characters and Unicode

Total characters667
Distinct characters123
Distinct categories7 ?
Distinct scripts2 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique11 ?
Unique (%)100.0%

Sample

1st row<제 외> ·통조림 식품 도매는 육류; 과실 및 채소류; 수산물 등 종류별로 분류(4632) ·조제 가공식품 도매(4632)
2nd row<제 외> ·통조림 식품 도매는 육류; 과실 및 채소류; 수산물 등 종류별로 분류(4632) ·조제 가공식품 도매(4632)
3rd row<제 외> ·과실; 채소; 육류 및 수산물 등 비가공식품 도매(4631) ·조제 음료 도매(4633)
4th row<제 외> ·캔 커피 및 차 음료 도매(46332)
5th row<제 외> ·낙농제품 및 아이스크림 도매(46324)
ValueCountFrequency (%)
11
 
7.7%
11
 
7.7%
9
 
6.3%
4
 
2.8%
또는 3
 
2.1%
육류 3
 
2.1%
수산물 3
 
2.1%
·조제 3
 
2.1%
도매(4632 2
 
1.4%
시계 2
 
1.4%
Other values (78) 92
64.3%
2023-12-10T23:16:13.069544image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
135
20.2%
35
 
5.2%
2 32
 
4.8%
3 27
 
4.0%
) 25
 
3.7%
( 25
 
3.7%
· 24
 
3.6%
21
 
3.1%
4 15
 
2.2%
13
 
1.9%
Other values (113) 315
47.2%

Most occurring categories

ValueCountFrequency (%)
Other Letter 317
47.5%
Space Separator 135
20.2%
Decimal Number 108
 
16.2%
Other Punctuation 35
 
5.2%
Close Punctuation 25
 
3.7%
Open Punctuation 25
 
3.7%
Math Symbol 22
 
3.3%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
35
 
11.0%
21
 
6.6%
13
 
4.1%
11
 
3.5%
10
 
3.2%
10
 
3.2%
9
 
2.8%
9
 
2.8%
8
 
2.5%
5
 
1.6%
Other values (97) 186
58.7%
Decimal Number
ValueCountFrequency (%)
2 32
29.6%
3 27
25.0%
4 15
13.9%
6 11
 
10.2%
0 8
 
7.4%
1 6
 
5.6%
9 5
 
4.6%
5 3
 
2.8%
7 1
 
0.9%
Other Punctuation
ValueCountFrequency (%)
· 24
68.6%
; 11
31.4%
Math Symbol
ValueCountFrequency (%)
< 11
50.0%
> 11
50.0%
Space Separator
ValueCountFrequency (%)
135
100.0%
Close Punctuation
ValueCountFrequency (%)
) 25
100.0%
Open Punctuation
ValueCountFrequency (%)
( 25
100.0%

Most occurring scripts

ValueCountFrequency (%)
Common 350
52.5%
Hangul 317
47.5%

Most frequent character per script

Hangul
ValueCountFrequency (%)
35
 
11.0%
21
 
6.6%
13
 
4.1%
11
 
3.5%
10
 
3.2%
10
 
3.2%
9
 
2.8%
9
 
2.8%
8
 
2.5%
5
 
1.6%
Other values (97) 186
58.7%
Common
ValueCountFrequency (%)
135
38.6%
2 32
 
9.1%
3 27
 
7.7%
) 25
 
7.1%
( 25
 
7.1%
· 24
 
6.9%
4 15
 
4.3%
< 11
 
3.1%
; 11
 
3.1%
6 11
 
3.1%
Other values (6) 34
 
9.7%

Most occurring blocks

ValueCountFrequency (%)
ASCII 326
48.9%
Hangul 317
47.5%
None 24
 
3.6%

Most frequent character per block

ASCII
ValueCountFrequency (%)
135
41.4%
2 32
 
9.8%
3 27
 
8.3%
) 25
 
7.7%
( 25
 
7.7%
4 15
 
4.6%
< 11
 
3.4%
; 11
 
3.4%
6 11
 
3.4%
> 11
 
3.4%
Other values (5) 23
 
7.1%
Hangul
ValueCountFrequency (%)
35
 
11.0%
21
 
6.6%
13
 
4.1%
11
 
3.5%
10
 
3.2%
10
 
3.2%
9
 
2.8%
9
 
2.8%
8
 
2.5%
5
 
1.6%
Other values (97) 186
58.7%
None
ValueCountFrequency (%)
· 24
100.0%

수정일시분초
Categorical

CONSTANT 

Distinct1
Distinct (%)3.4%
Missing0
Missing (%)0.0%
Memory size364.0 B
2019-11-27
29 

Length

Max length10
Median length10
Mean length10
Min length10

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2019-11-27
2nd row2019-11-27
3rd row2019-11-27
4th row2019-11-27
5th row2019-11-27

Common Values

ValueCountFrequency (%)
2019-11-27 29
100.0%

Length

2023-12-10T23:16:13.342898image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-10T23:16:13.513500image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2019-11-27 29
100.0%

작업자명
Categorical

CONSTANT 

Distinct1
Distinct (%)3.4%
Missing0
Missing (%)0.0%
Memory size364.0 B
KED_SYSTEM
29 

Length

Max length10
Median length10
Mean length10
Min length10

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st rowKED_SYSTEM
2nd rowKED_SYSTEM
3rd rowKED_SYSTEM
4th rowKED_SYSTEM
5th rowKED_SYSTEM

Common Values

ValueCountFrequency (%)
KED_SYSTEM 29
100.0%

Length

2023-12-10T23:16:13.809947image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-10T23:16:13.982361image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
ked_system 29
100.0%

표준산업분류코드
Real number (ℝ)

HIGH CORRELATION  MISSING 

Distinct10
Distinct (%)50.0%
Missing9
Missing (%)31.0%
Infinite0
Infinite (%)0.0%
Mean3683.3
Minimum514
Maximum5149
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size393.0 B
2023-12-10T23:16:14.154068image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum514
5-th percentile514
Q13062.75
median4537
Q35147.25
95-th percentile5149
Maximum5149
Range4635
Interquartile range (IQR)2084.5

Descriptive statistics

Standard deviation1945.5694
Coefficient of variation (CV)0.52821367
Kurtosis-0.76670754
Mean3683.3
Median Absolute Deviation (MAD)612
Skewness-1.0132555
Sum73666
Variance3785240.3
MonotonicityNot monotonic
2023-12-10T23:16:14.331447image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=10)
ValueCountFrequency (%)
514 4
13.8%
5149 4
13.8%
3931 3
 
10.3%
5147 2
 
6.9%
5146 2
 
6.9%
5148 1
 
3.4%
5143 1
 
3.4%
518 1
 
3.4%
3911 1
 
3.4%
3915 1
 
3.4%
(Missing) 9
31.0%
ValueCountFrequency (%)
514 4
13.8%
518 1
 
3.4%
3911 1
 
3.4%
3915 1
 
3.4%
3931 3
10.3%
5143 1
 
3.4%
5146 2
6.9%
5147 2
6.9%
5148 1
 
3.4%
5149 4
13.8%
ValueCountFrequency (%)
5149 4
13.8%
5148 1
 
3.4%
5147 2
6.9%
5146 2
6.9%
5143 1
 
3.4%
3931 3
10.3%
3915 1
 
3.4%
3911 1
 
3.4%
518 1
 
3.4%
514 4
13.8%

유럽표준산업분류코드
Real number (ℝ)

HIGH CORRELATION  MISSING 

Distinct10
Distinct (%)50.0%
Missing9
Missing (%)31.0%
Infinite0
Infinite (%)0.0%
Mean4280.95
Minimum3212
Maximum4639
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size393.0 B
2023-12-10T23:16:14.504696image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum3212
5-th percentile3212
Q14278.25
median4633.5
Q34638
95-th percentile4639
Maximum4639
Range1427
Interquartile range (IQR)359.75

Descriptive statistics

Standard deviation630.35708
Coefficient of variation (CV)0.14724701
Kurtosis-0.4966192
Mean4280.95
Median Absolute Deviation (MAD)4.5
Skewness-1.2504833
Sum85619
Variance397350.05
MonotonicityNot monotonic
2023-12-10T23:16:14.696594image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=10)
ValueCountFrequency (%)
4639 4
13.8%
3220 3
 
10.3%
4631 2
 
6.9%
4632 2
 
6.9%
4638 2
 
6.9%
4637 2
 
6.9%
3212 2
 
6.9%
4636 1
 
3.4%
4633 1
 
3.4%
4634 1
 
3.4%
(Missing) 9
31.0%
ValueCountFrequency (%)
3212 2
6.9%
3220 3
10.3%
4631 2
6.9%
4632 2
6.9%
4633 1
 
3.4%
4634 1
 
3.4%
4636 1
 
3.4%
4637 2
6.9%
4638 2
6.9%
4639 4
13.8%
ValueCountFrequency (%)
4639 4
13.8%
4638 2
6.9%
4637 2
6.9%
4636 1
 
3.4%
4634 1
 
3.4%
4633 1
 
3.4%
4632 2
6.9%
4631 2
6.9%
3220 3
10.3%
3212 2
6.9%

Interactions

2023-12-10T23:16:05.755112image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-10T23:16:05.446613image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-10T23:16:05.912552image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-10T23:16:05.596533image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-10T23:16:14.876484image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
업종코드계층구분코드업종코드명업종코드영문명업종상세내용예외대상업종내용표준산업분류코드유럽표준산업분류코드
업종코드1.0001.0001.0001.0001.0001.0001.0001.000
계층구분코드1.0001.0000.0000.0001.0001.000NaNNaN
업종코드명1.0000.0001.0001.0001.0001.0001.0001.000
업종코드영문명1.0000.0001.0001.0001.0001.0001.0001.000
업종상세내용1.0001.0001.0001.0001.0001.0001.0001.000
예외대상업종내용1.0001.0001.0001.0001.0001.0001.0001.000
표준산업분류코드1.000NaN1.0001.0001.0001.0001.0001.000
유럽표준산업분류코드1.000NaN1.0001.0001.0001.0001.0001.000
2023-12-10T23:16:15.094607image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
표준산업분류코드유럽표준산업분류코드계층구분코드
표준산업분류코드1.0000.3281.000
유럽표준산업분류코드0.3281.0001.000
계층구분코드1.0001.0001.000

Missing values

2023-12-10T23:16:06.163049image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-10T23:16:06.501388image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
2023-12-10T23:16:06.781314image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

Sample

업종코드계층구분코드업종코드명업종코드영문명업종상세내용예외대상업종내용수정일시분초작업자명표준산업분류코드유럽표준산업분류코드
0G463115과실류 도매업Wholesale of fruit견과를 포함한 각종 과실류를 도매하는 산업활동을 말한다. <예 시> ·견과류(대추; 밤; 은행 등) 도매 ·사과; 배; 감; 포도 등 과일 도매<제 외> ·통조림 식품 도매는 육류; 과실 및 채소류; 수산물 등 종류별로 분류(4632) ·조제 가공식품 도매(4632)2019-11-27KED_SYSTEM51484631
1G463125채소류; 서류 및 향신작물류 도매업Wholesale of vegetables; root and tube crops and spice crops각종 채소류; 서류 및 향신작물류를 도매하는 산업활동을 말한다. <예 시> ·채소(각종 나물) 도매 ·고구마; 감자 도매 ·마늘; 도라지; 오이; 호박 도매<제 외> ·통조림 식품 도매는 육류; 과실 및 채소류; 수산물 등 종류별로 분류(4632) ·조제 가공식품 도매(4632)2019-11-27KED_SYSTEM51474631
2G463135육류 도매업Wholesale of meat가축 및 기타 육지동물의 신선·냉장·냉동한 도축고기를 도매하는 산업활동을 말한다. <예 시> ·우육 및 돈육 도매 ·가금육 도매 ·기타 조류 고기 도매 ·냉장육 도매<NA>2019-11-27KED_SYSTEM51464632
3G463145건어물 및 젓갈류 도매업Wholesale of dried and salted fishery products각종 해산물 및 민물고기 등을 건조; 염장한 수산물을 도매하는 산업활동을 말한다. <예 시> ·건어물 도매 ·(조미하지 않은) 젓갈류 도매<NA>2019-11-27KED_SYSTEM5144638
4G463155신선; 냉동 및 기타 수산물 도매업Wholesale of fresh; frozen and other fishery products각종 해산물 및 민물고기 등의 살아있는 것; 신선한 것; 냉동 및 기타 단순 가공한 수산물을 도매하는 산업활동을 말한다. <예 시> ·신선 어류 도매 ·신선 해조류 도매 ·냉동 어개류(어류; 게; 새우 등) 도매<NA>2019-11-27KED_SYSTEM51464638
5G463195기타 신선식품 및 단순 가공식품 도매업Wholesale of other fresh food and dried; salted and frozen food기타 가공하지 않은 식품이나 냉동·건조·염장 등과 같은 단순 가공한 식품을 도매하는 산업활동을 말한다. <예 시> ·벌꿀 도매 ·조란 도매 ·식용 소금(천일염 포함) 도매<NA>2019-11-27KED_SYSTEM51494639
6G46324가공식품 도매업Wholesale of processed food과실; 채소; 육류; 수산물 등을 가공하여 만든 가공식품 및 낙농품 등을 도매하는 산업활동을 말한다.<제 외> ·과실; 채소; 육류 및 수산물 등 비가공식품 도매(4631) ·조제 음료 도매(4633)2019-11-27KED_SYSTEM<NA><NA>
7G463215육류 가공식품 도매업Wholesale of meat processed food가축 및 기타 육지동물의 도축고기를 가공하여 만든 식품을 도매하는 산업활동을 말한다. <예 시> ·육류 통조림 도매 ·햄 및 소시지 도매 ·가금육 통조림 도매 ·베이컨 도매 ·육류 훈제식품 도매<NA>2019-11-27KED_SYSTEM51474632
8G463225수산물 가공식품 도매업Wholesale of fishery processed food해산물 및 민물고기 등 수산물의 가공식품을 도매하는 산업활동을 말한다. <예 시> ·물고기 통조림 도매 ·어묵 도매 ·수산물 액젓 도매 ·구운 김 도매 ·맛살 도매 ·훈제 어류 도매<NA>2019-11-27KED_SYSTEM51494639
9G463235빵류; 과자류; 당류; 초콜릿 도매업Wholesale of bakery; flour confectionery; sugar and chocolate products빵류; 과자류; 떡류; 당류 및 초콜릿 등을 도매하는 산업활동을 말한다. <예 시> ·비스킷 및 크래커 도매 ·사탕 및 캔디 도매 ·초콜릿 및 껌 도매 ·햄버거 도매 ·피자 도매 ·빵가루 도매 ·설탕 및 당류 도매 ·코코아 분말 및 조제품 도매<NA>2019-11-27KED_SYSTEM5144636
업종코드계층구분코드업종코드명업종코드영문명업종상세내용예외대상업종내용수정일시분초작업자명표준산업분류코드유럽표준산업분류코드
19C33114귀금속 및 관련제품 제조업Manufacture of jewellery and related articles<NA><NA>2019-11-27KED_SYSTEM<NA><NA>
20C331105귀금속 및 관련제품 제조업Manufacture of jewellery and related articles구입한 천연·인조귀석; 준귀석; 진주; 금; 은 및 기타 귀금속으로 장신구 및 세공품; 식기류; 예술 또는 경기용 메달 등을 제조 또는 세공하는 산업활동을 말한다. 귀금속 여부를 불문한 법정 주화 및 기타 주화를 제조하는 활동을 포함한다. <예 시> ·귀금속 장신용품 제조 ·귀금속 목걸이 제조 ·귀금속 메달 제조 ·귀석 제품 제조(합성; 재생) ·귀금속제 주화 제조<제 외> ·치과용 충전재와 살균한 봉합물 제조(21300) ·연마재 제조(23992) ·장식용 메달; 상패 등의 비귀금속 제품 제조(259) ·귀금속제의 시계 및 시계 부품 제조(2740) ·모조 장신품 제조(3312)2019-11-27KED_SYSTEM39113212
21C33124모조 귀금속 및 모조 장신용품 제조업Manufacture of imitation jewellery and costume jewellery<NA><NA>2019-11-27KED_SYSTEM<NA><NA>
22C331205모조 귀금속 및 모조 장신용품 제조업Manufacture of imitation jewellery and costume jewellery귀금속; 귀석 이외의 각종 재료로 모조 장신용품을 제조하는 산업활동을 말한다. <예 시> ·모조 목걸이; 팔찌 제조 ·모조 브로치 제조<NA>2019-11-27KED_SYSTEM39153212
23C3323악기 제조업Manufacture of musical instruments<NA><NA>2019-11-27KED_SYSTEM<NA><NA>
24C33204악기 제조업Manufacture of musical instruments피아노; 오르간; 현악기; 관악기 및 타악기 등의 각종 악기를 제조하는 산업활동을 말한다.<제 외> ·오디오; 마이크로폰; 헤드폰 및 이와 유사한 음향기기 제조(2652) ·장난감 악기 제조(3340)2019-11-27KED_SYSTEM<NA><NA>
25C332015건반 악기 제조업Manufacture of keyboard instruments피아노 등 건반 현악기를 제조하는 산업활동을 말한다. 리드 오르간; 파이프 오르간을 제조하는 산업활동도 포함한다. <예 시> ·피아노; 하프시코드; 스피넷; 하모늄 제조 ·오르간; 파이프 오르간 제조<제 외> ·전자식 건반 현악기 제조(33202) ·하모니카 제조(33209)2019-11-27KED_SYSTEM39313220
26C332025전자 악기 제조업Manufacture of electronic instruments소리가 전기·전자식으로 발생 및 증폭하도록 설계된 전자 건반 악기; 전자 현악기 등을 제조하는 산업활동을 말한다. <예 시> ·전자 악기 제조 ·전자 건반 악기 제조 ·전자 현악기 제조 ·전자 기타 제조<NA>2019-11-27KED_SYSTEM39313220
27C332095기타 악기 제조업Manufacture of other musical instruments현악기; 각종 고유 국악기(국악용 현악기; 타악기; 관악기 등 포함) 및 기타 악기를 제조하는 산업활동을 포함한다. <예 시> ·현악기 제조 ·하프 제조 ·바이올린 제조 ·만도린 제조 ·첼로 제조 ·기타 제조 ·국악 현악기 제조 ·뮤지컬(뮤직) 박스 제조 ·하모니카 제조 ·관악기 제조 ·리코더 제조 ·트럼펫 제조 ·트롬본 제조 ·휘슬 제조 ·목금 제조 ·탬버린 제조 ·북 제조 ·마라카스 제조 ·타악기 제조 ·캐스터네츠 제조 ·심벌즈 제조 ·뮤지컬 소 제조 ·아코디언 제조<제 외> ·전자식 현악기 제조(33202)2019-11-27KED_SYSTEM39313220
28C3333운동 및 경기용구 제조업Manufacture of sports and athletic goods<NA><NA>2019-11-27KED_SYSTEM<NA><NA>