Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 8341 |
Missing cells (%) | 16.7% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 478.5 KiB |
Average record size in memory | 49.0 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 1 |
Text | 2 |
DateTime | 1 |
Dataset
Description | 위험성평가 인정신청서를 제출한 사업장의 위험성평가 결과와 실시규정을 심사하여 선정된 우수 사업장 현황을 제공 |
---|---|
Author | 한국산업안전보건공단 |
URL | https://www.data.go.kr/data/3038400/fileData.do |
Reproduction
Analysis started | 2023-12-11 23:25:18.548270 |
---|---|
Analysis finished | 2023-12-11 23:25:19.679152 |
Duration | 1.13 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
글번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 6459.2061 |
Minimum | 1 |
---|---|
Maximum | 12969 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 640.95 |
Q1 | 3215.75 |
median | 6438.5 |
Q3 | 9687.25 |
95-th percentile | 12323.05 |
Maximum | 12969 |
Range | 12968 |
Interquartile range (IQR) | 6471.5 |
Descriptive statistics
Standard deviation | 3740.6873 |
---|---|
Coefficient of variation (CV) | 0.57912493 |
Kurtosis | -1.1959182 |
Mean | 6459.2061 |
Median Absolute Deviation (MAD) | 3237.5 |
Skewness | 0.010053763 |
Sum | 64592061 |
Variance | 13992742 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
8281 | 1 | < 0.1% |
4075 | 1 | < 0.1% |
2981 | 1 | < 0.1% |
5835 | 1 | < 0.1% |
6234 | 1 | < 0.1% |
8048 | 1 | < 0.1% |
3746 | 1 | < 0.1% |
12384 | 1 | < 0.1% |
12420 | 1 | < 0.1% |
7800 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 | |
11 | 1 |
Value | Count | Frequency (%) |
12969 | 1 | |
12968 | 1 | |
12967 | 1 | |
12966 | 1 | |
12965 | 1 | |
12964 | 1 | |
12963 | 1 | |
12962 | 1 | |
12960 | 1 | |
12959 | 1 |
노동지청명
Categorical
HIGH CORRELATION
 
Distinct | 50 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
경기 | 543 |
---|---|
안산 | 461 |
성남 | 442 |
양산 | 430 |
울산 | 415 |
Other values (45) |
Length
Max length | 7 |
---|---|
Median length | 2 |
Mean length | 2.4954 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 울산 |
---|---|
2nd row | 양산 |
3rd row | 울산 |
4th row | 대전청 |
5th row | 서울남부 |
Common Values
Value | Count | Frequency (%) |
경기 | 543 | 5.4% |
안산 | 461 | 4.6% |
성남 | 442 | 4.4% |
양산 | 430 | 4.3% |
울산 | 415 | 4.2% |
창원 | 403 | 4.0% |
부천 | 368 | 3.7% |
천안 | 334 | 3.3% |
대전청 | 331 | 3.3% |
대구서부 | 329 | 3.3% |
Other values (40) | 5944 |
Length
Value | Count | Frequency (%) |
경기 | 543 | 5.4% |
안산 | 461 | 4.6% |
성남 | 442 | 4.4% |
양산 | 430 | 4.3% |
울산 | 415 | 4.2% |
창원 | 403 | 4.0% |
부천 | 368 | 3.7% |
천안 | 334 | 3.3% |
대전청 | 331 | 3.3% |
대구서부 | 329 | 3.3% |
Other values (40) | 5944 |
사업장명
Text
Distinct | 8646 |
---|---|
Distinct (%) | 86.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
주)스타벅스커피코리아 | 158 | 1.6% |
주택관리공단(주 | 106 | 1.1% |
주)현대그린푸드 | 81 | 0.8% |
주)신세계푸드 | 80 | 0.8% |
주)현대그린푸드/음식 | 76 | 0.8% |
주)케이티 | 60 | 0.6% |
한화호텔앤드리조트(주 | 47 | 0.5% |
주)kt | 31 | 0.3% |
주)한화에스테이트 | 27 | 0.3% |
주택관리공단(주)(901)(주 | 26 | 0.3% |
Other values (8661) | 9348 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 7887 | 9.2% |
( | 5559 | 6.5% |
) | 5536 | 6.4% |
사 | 2652 | 3.1% |
스 | 2112 | 2.5% |
회 | 2076 | 2.4% |
식 | 2006 | 2.3% |
이 | 1924 | 2.2% |
업 | 1608 | 1.9% |
리 | 1400 | 1.6% |
Other values (792) | 53404 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 71227 | |
Close Punctuation | 6037 | 7.0% |
Open Punctuation | 6032 | 7.0% |
Uppercase Letter | 1404 | 1.6% |
Other Punctuation | 462 | 0.5% |
Lowercase Letter | 375 | 0.4% |
Decimal Number | 340 | 0.4% |
Dash Punctuation | 212 | 0.2% |
Space Separator | 57 | 0.1% |
Connector Punctuation | 14 | < 0.1% |
Other values (2) | 4 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 7887 | 11.1% |
사 | 2652 | 3.7% |
스 | 2112 | 3.0% |
회 | 2076 | 2.9% |
식 | 2006 | 2.8% |
이 | 1924 | 2.7% |
업 | 1608 | 2.3% |
리 | 1400 | 2.0% |
에 | 1189 | 1.7% |
산 | 1177 | 1.7% |
Other values (707) | 47196 |
Uppercase Letter
Value | Count | Frequency (%) |
T | 145 | 10.3% |
E | 128 | 9.1% |
S | 126 | 9.0% |
C | 126 | 9.0% |
N | 96 | 6.8% |
G | 90 | 6.4% |
K | 87 | 6.2% |
M | 76 | 5.4% |
O | 73 | 5.2% |
L | 68 | 4.8% |
Other values (16) | 389 |
Lowercase Letter
Value | Count | Frequency (%) |
o | 49 | |
e | 48 | |
n | 32 | 8.5% |
t | 32 | 8.5% |
r | 24 | 6.4% |
a | 21 | 5.6% |
c | 21 | 5.6% |
d | 20 | 5.3% |
i | 18 | 4.8% |
l | 16 | 4.3% |
Other values (12) | 94 |
Decimal Number
Value | Count | Frequency (%) |
1 | 102 | |
2 | 80 | |
0 | 45 | |
9 | 37 | 10.9% |
3 | 30 | 8.8% |
5 | 12 | 3.5% |
7 | 11 | 3.2% |
4 | 10 | 2.9% |
6 | 9 | 2.6% |
8 | 2 | 0.6% |
Other values (2) | 2 | 0.6% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 287 | |
. | 76 | 16.5% |
& | 36 | 7.8% |
. | 23 | 5.0% |
, | 19 | 4.1% |
: | 9 | 1.9% |
, | 5 | 1.1% |
@ | 3 | 0.6% |
· | 2 | 0.4% |
# | 1 | 0.2% |
Open Punctuation
Value | Count | Frequency (%) |
( | 5559 | |
( | 465 | 7.7% |
[ | 8 | 0.1% |
Close Punctuation
Value | Count | Frequency (%) |
) | 5536 | |
) | 493 | 8.2% |
] | 8 | 0.1% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 210 | |
- | 2 | 0.9% |
Space Separator
Value | Count | Frequency (%) |
29 | ||
28 |
Math Symbol
Value | Count | Frequency (%) |
< | 1 | |
> | 1 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 14 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 71224 | |
Common | 13156 | 15.3% |
Latin | 1779 | 2.1% |
Han | 5 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 7887 | 11.1% |
사 | 2652 | 3.7% |
스 | 2112 | 3.0% |
회 | 2076 | 2.9% |
식 | 2006 | 2.8% |
이 | 1924 | 2.7% |
업 | 1608 | 2.3% |
리 | 1400 | 2.0% |
에 | 1189 | 1.7% |
산 | 1177 | 1.7% |
Other values (703) | 47193 |
Latin
Value | Count | Frequency (%) |
T | 145 | 8.2% |
E | 128 | 7.2% |
S | 126 | 7.1% |
C | 126 | 7.1% |
N | 96 | 5.4% |
G | 90 | 5.1% |
K | 87 | 4.9% |
M | 76 | 4.3% |
O | 73 | 4.1% |
L | 68 | 3.8% |
Other values (38) | 764 |
Common
Value | Count | Frequency (%) |
( | 5559 | |
) | 5536 | |
) | 493 | 3.7% |
( | 465 | 3.5% |
/ | 287 | 2.2% |
- | 210 | 1.6% |
1 | 102 | 0.8% |
2 | 80 | 0.6% |
. | 76 | 0.6% |
0 | 45 | 0.3% |
Other values (26) | 303 | 2.3% |
Han
Value | Count | Frequency (%) |
炅 | 1 | |
楠 | 1 | |
休 | 1 | |
心 | 1 | |
光 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 71221 | |
ASCII | 13914 | 16.1% |
None | 1023 | 1.2% |
CJK | 5 | < 0.1% |
Compat Jamo | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 7887 | 11.1% |
사 | 2652 | 3.7% |
스 | 2112 | 3.0% |
회 | 2076 | 2.9% |
식 | 2006 | 2.8% |
이 | 1924 | 2.7% |
업 | 1608 | 2.3% |
리 | 1400 | 2.0% |
에 | 1189 | 1.7% |
산 | 1177 | 1.7% |
Other values (701) | 47190 |
ASCII
Value | Count | Frequency (%) |
( | 5559 | |
) | 5536 | |
/ | 287 | 2.1% |
- | 210 | 1.5% |
T | 145 | 1.0% |
E | 128 | 0.9% |
S | 126 | 0.9% |
C | 126 | 0.9% |
1 | 102 | 0.7% |
N | 96 | 0.7% |
Other values (64) | 1599 | 11.5% |
None
Value | Count | Frequency (%) |
) | 493 | |
( | 465 | |
28 | 2.7% | |
. | 23 | 2.2% |
, | 5 | 0.5% |
- | 2 | 0.2% |
㈜ | 2 | 0.2% |
· | 2 | 0.2% |
2 | 1 | 0.1% |
6 | 1 | 0.1% |
CJK
Value | Count | Frequency (%) |
炅 | 1 | |
楠 | 1 | |
休 | 1 | |
心 | 1 | |
光 | 1 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 1 |
공사장명
Text
MISSING
 
Distinct | 1434 |
---|---|
Distinct (%) | 86.4% |
Missing | 8341 |
Missing (%) | 83.4% |
Memory size | 156.2 KiB |
Length
Max length | 58 |
---|---|
Median length | 37 |
Mean length | 12.086197 |
Min length | 2 |
Characters and Unicode
Total characters | 20051 |
---|---|
Distinct characters | 579 |
Distinct categories | 12 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 1380 ? |
---|---|
Unique (%) | 83.2% |
Sample
1st row | 충남대정문 |
---|---|
2nd row | 롯데마트김포공항점 |
3rd row | 마트송도 |
4th row | SK hynix 자회사형 표준사업장 Project(청주) |
5th row | 관악구민종합체육센터 |
Value | Count | Frequency (%) |
주)케이티 | 82 | 3.0% |
주)스타벅스커피코리아 | 66 | 2.4% |
신축공사 | 51 | 1.8% |
이마트 | 35 | 1.3% |
주)서울메트로환경 | 24 | 0.9% |
한화호텔앤드리조트(주 | 23 | 0.8% |
주)미래비엠 | 22 | 0.8% |
롯데마트 | 18 | 0.6% |
주)현대그린푸드/음식 | 17 | 0.6% |
롯데백화점 | 15 | 0.5% |
Other values (1898) | 2420 |
Most occurring characters
Value | Count | Frequency (%) |
1114 | 5.6% | |
주 | 1000 | 5.0% |
( | 794 | 4.0% |
) | 789 | 3.9% |
리 | 573 | 2.9% |
공 | 437 | 2.2% |
점 | 414 | 2.1% |
스 | 405 | 2.0% |
사 | 400 | 2.0% |
관 | 359 | 1.8% |
Other values (569) | 13766 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 15854 | |
Space Separator | 1114 | 5.6% |
Open Punctuation | 813 | 4.1% |
Close Punctuation | 808 | 4.0% |
Uppercase Letter | 536 | 2.7% |
Decimal Number | 417 | 2.1% |
Lowercase Letter | 231 | 1.2% |
Other Punctuation | 124 | 0.6% |
Dash Punctuation | 117 | 0.6% |
Other Symbol | 16 | 0.1% |
Other values (2) | 21 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 1000 | 6.3% |
리 | 573 | 3.6% |
공 | 437 | 2.8% |
점 | 414 | 2.6% |
스 | 405 | 2.6% |
사 | 400 | 2.5% |
관 | 359 | 2.3% |
이 | 351 | 2.2% |
지 | 266 | 1.7% |
트 | 257 | 1.6% |
Other values (486) | 11392 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 59 | |
C | 56 | 10.4% |
T | 48 | 9.0% |
K | 47 | 8.8% |
D | 34 | 6.3% |
O | 31 | 5.8% |
P | 30 | 5.6% |
A | 30 | 5.6% |
L | 28 | 5.2% |
I | 26 | 4.9% |
Other values (14) | 147 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 27 | |
r | 22 | 9.5% |
o | 22 | 9.5% |
n | 21 | 9.1% |
t | 17 | 7.4% |
a | 17 | 7.4% |
i | 13 | 5.6% |
l | 13 | 5.6% |
k | 10 | 4.3% |
p | 9 | 3.9% |
Other values (14) | 60 |
Decimal Number
Value | Count | Frequency (%) |
1 | 113 | |
2 | 102 | |
0 | 50 | |
3 | 39 | 9.4% |
9 | 27 | 6.5% |
8 | 20 | 4.8% |
4 | 16 | 3.8% |
7 | 16 | 3.8% |
5 | 15 | 3.6% |
6 | 14 | 3.4% |
Other values (3) | 5 | 1.2% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 69 | |
, | 24 | 19.4% |
& | 15 | 12.1% |
. | 9 | 7.3% |
' | 2 | 1.6% |
: | 2 | 1.6% |
· | 2 | 1.6% |
# | 1 | 0.8% |
Math Symbol
Value | Count | Frequency (%) |
~ | 7 | |
+ | 2 | 18.2% |
> | 1 | 9.1% |
< | 1 | 9.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 794 | |
( | 13 | 1.6% |
[ | 6 | 0.7% |
Close Punctuation
Value | Count | Frequency (%) |
) | 789 | |
) | 14 | 1.7% |
] | 5 | 0.6% |
Space Separator
Value | Count | Frequency (%) |
1114 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 117 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 16 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 10 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 15870 | |
Common | 3414 | 17.0% |
Latin | 767 | 3.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 1000 | 6.3% |
리 | 573 | 3.6% |
공 | 437 | 2.8% |
점 | 414 | 2.6% |
스 | 405 | 2.6% |
사 | 400 | 2.5% |
관 | 359 | 2.3% |
이 | 351 | 2.2% |
지 | 266 | 1.7% |
트 | 257 | 1.6% |
Other values (487) | 11408 |
Latin
Value | Count | Frequency (%) |
S | 59 | 7.7% |
C | 56 | 7.3% |
T | 48 | 6.3% |
K | 47 | 6.1% |
D | 34 | 4.4% |
O | 31 | 4.0% |
P | 30 | 3.9% |
A | 30 | 3.9% |
L | 28 | 3.7% |
e | 27 | 3.5% |
Other values (38) | 377 |
Common
Value | Count | Frequency (%) |
1114 | ||
( | 794 | |
) | 789 | |
- | 117 | 3.4% |
1 | 113 | 3.3% |
2 | 102 | 3.0% |
/ | 69 | 2.0% |
0 | 50 | 1.5% |
3 | 39 | 1.1% |
9 | 27 | 0.8% |
Other values (24) | 200 | 5.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 15854 | |
ASCII | 4147 | 20.7% |
None | 50 | 0.2% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1114 | ||
( | 794 | |
) | 789 | |
- | 117 | 2.8% |
1 | 113 | 2.7% |
2 | 102 | 2.5% |
/ | 69 | 1.7% |
S | 59 | 1.4% |
C | 56 | 1.4% |
0 | 50 | 1.2% |
Other values (66) | 884 |
Hangul
Value | Count | Frequency (%) |
주 | 1000 | 6.3% |
리 | 573 | 3.6% |
공 | 437 | 2.8% |
점 | 414 | 2.6% |
스 | 405 | 2.6% |
사 | 400 | 2.5% |
관 | 359 | 2.3% |
이 | 351 | 2.2% |
지 | 266 | 1.7% |
트 | 257 | 1.6% |
Other values (486) | 11392 |
None
Value | Count | Frequency (%) |
㈜ | 16 | |
) | 14 | |
( | 13 | |
3 | 2 | 4.0% |
4 | 2 | 4.0% |
· | 2 | 4.0% |
1 | 1 | 2.0% |
인정일
Date
Distinct | 767 |
---|---|
Distinct (%) | 7.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2017-08-01 00:00:00 |
---|---|
Maximum | 2020-07-31 00:00:00 |
글번호 | 노동지청명 | |
---|---|---|
글번호 | 1.000 | 1.000 |
노동지청명 | 1.000 | 1.000 |
글번호 | 노동지청명 | |
---|---|---|
글번호 | 1.000 | 0.962 |
노동지청명 | 0.962 | 1.000 |
글번호 | 노동지청명 | 사업장명 | 공사장명 | 인정일 | |
---|---|---|---|---|---|
8280 | 8281 | 울산 | (주)로리텍 | <NA> | 2017-08-09 |
7636 | 7637 | 양산 | (주)기성 | <NA> | 2018-11-29 |
8546 | 8547 | 울산 | 정진기업 | <NA> | 2018-11-13 |
3369 | 3370 | 대전청 | (주)스타벅스커피코리아 | 충남대정문 | 2018-03-29 |
5103 | 5104 | 서울남부 | (주)아워홈_본사등 | 롯데마트김포공항점 | 2018-11-14 |
2489 | 2490 | 대구서부 | 주식회사대원정밀 | <NA> | 2019-09-10 |
7493 | 7494 | 양산 | 경덕산업주식회사 | <NA> | 2020-01-01 |
6955 | 6956 | 안산 | 주식회사중앙브레인(경기지점) | <NA> | 2019-10-02 |
3124 | 3125 | 대전청 | 계룡유통 | <NA> | 2017-11-16 |
10220 | 10221 | 중부청 | 이조케터링서비스(주) | 마트송도 | 2017-08-10 |
글번호 | 노동지청명 | 사업장명 | 공사장명 | 인정일 | |
---|---|---|---|---|---|
9152 | 9153 | 의정부 | 대흥화공 | <NA> | 2019-03-08 |
982 | 983 | 경기 | 주식회사디케이텍인더스트리 | <NA> | 2019-08-22 |
8644 | 8645 | 울산 | 대성기업 | <NA> | 2018-04-25 |
8807 | 8808 | 원주 | (주)하나플랜트 | <NA> | 2019-10-29 |
6213 | 6214 | 성남 | 세준푸드농업회사법인주식회사 | <NA> | 2020-01-16 |
3580 | 3581 | 목포 | 지팸중공업(주) | <NA> | 2017-11-27 |
10509 | 10510 | 중부청 | 신영산업사 | <NA> | 2019-01-10 |
12448 | 12449 | 평택 | 주식회사아로 | <NA> | 2019-07-25 |
4301 | 4302 | 부천 | 성일식품 | <NA> | 2018-01-17 |
10323 | 10324 | 중부청 | (주)서브엔 | 롯데백화점 인천터미널점 | 2019-12-05 |