Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 3.4 KiB |
Average record size in memory | 35.3 B |
Variable types
Numeric | 1 |
---|---|
Text | 1 |
Categorical | 2 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 환경부산하기관 |
URL | https://www.bigdata-environment.kr/user/data_market/detail.do?id=e62efba0-38bb-11ea-be28-4fa0eb812a46 |
Reproduction
Analysis started | 2023-12-10 12:36:49.443166 |
---|---|
Analysis finished | 2023-12-10 12:36:50.196460 |
Duration | 0.75 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
번호
Real number (ℝ)
UNIQUE
 
Distinct | 100 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1162.47 |
Minimum | 1112 |
---|---|
Maximum | 1212 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 1112 |
---|---|
5-th percentile | 1117.95 |
Q1 | 1137.75 |
median | 1162.5 |
Q3 | 1187.25 |
95-th percentile | 1207.05 |
Maximum | 1212 |
Range | 100 |
Interquartile range (IQR) | 49.5 |
Descriptive statistics
Standard deviation | 29.062613 |
---|---|
Coefficient of variation (CV) | 0.025000742 |
Kurtosis | -1.1920587 |
Mean | 1162.47 |
Median Absolute Deviation (MAD) | 25 |
Skewness | -0.0059162588 |
Sum | 116247 |
Variance | 844.63545 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1212 | 1 | 1.0% |
1147 | 1 | 1.0% |
1137 | 1 | 1.0% |
1138 | 1 | 1.0% |
1139 | 1 | 1.0% |
1141 | 1 | 1.0% |
1142 | 1 | 1.0% |
1143 | 1 | 1.0% |
1144 | 1 | 1.0% |
1150 | 1 | 1.0% |
Other values (90) | 90 |
Value | Count | Frequency (%) |
1112 | 1 | |
1113 | 1 | |
1114 | 1 | |
1116 | 1 | |
1117 | 1 | |
1118 | 1 | |
1119 | 1 | |
1120 | 1 | |
1121 | 1 | |
1122 | 1 |
Value | Count | Frequency (%) |
1212 | 1 | |
1211 | 1 | |
1210 | 1 | |
1209 | 1 | |
1208 | 1 | |
1207 | 1 | |
1206 | 1 | |
1205 | 1 | |
1204 | 1 | |
1203 | 1 |
기관명
Text
Distinct | 51 |
---|---|
Distinct (%) | 51.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Length
Max length | 26 |
---|---|
Median length | 20 |
Mean length | 12.38 |
Min length | 7 |
Characters and Unicode
Total characters | 1238 |
---|---|
Distinct characters | 115 |
Distinct categories | 6 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 28 ? |
---|---|
Unique (%) | 28.0% |
Sample
1st row | (사)KOTITI시험연구원 |
---|---|
2nd row | (사)KOTITI시험연구원 |
3rd row | (사)KOTITI시험연구원 |
4th row | (사)대한산업보건협회 광주전남북지역본부 |
5th row | (사)대한산업보건협회 대전충남북지역본부 |
Value | Count | Frequency (%) |
재)한국화학융합시험연구원 | 10 | 8.5% |
재 | 9 | 7.6% |
fiti시험연구원(오창분원 | 9 | 7.6% |
재)한국환경수도연구원 | 6 | 5.1% |
주)그린환경 | 5 | 4.2% |
재)한국건설생활환경시험연구원 | 5 | 4.2% |
사)대한산업보건협회 | 4 | 3.4% |
재)환경보건기술연구원 | 4 | 3.4% |
사)kotiti시험연구원 | 3 | 2.5% |
주)경북환경 | 3 | 2.5% |
Other values (44) | 60 |
Most occurring characters
Value | Count | Frequency (%) |
( | 110 | 8.9% |
) | 110 | 8.9% |
경 | 70 | 5.7% |
구 | 65 | 5.3% |
원 | 63 | 5.1% |
연 | 62 | 5.0% |
환 | 61 | 4.9% |
재 | 59 | 4.8% |
한 | 33 | 2.7% |
국 | 30 | 2.4% |
Other values (105) | 575 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 942 | |
Open Punctuation | 110 | 8.9% |
Close Punctuation | 110 | 8.9% |
Uppercase Letter | 57 | 4.6% |
Space Separator | 18 | 1.5% |
Connector Punctuation | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
경 | 70 | 7.4% |
구 | 65 | 6.9% |
원 | 63 | 6.7% |
연 | 62 | 6.6% |
환 | 61 | 6.5% |
재 | 59 | 6.3% |
한 | 33 | 3.5% |
국 | 30 | 3.2% |
시 | 28 | 3.0% |
험 | 28 | 3.0% |
Other values (93) | 443 |
Uppercase Letter
Value | Count | Frequency (%) |
I | 24 | |
T | 15 | |
F | 9 | 15.8% |
K | 3 | 5.3% |
O | 3 | 5.3% |
E | 1 | 1.8% |
H | 1 | 1.8% |
S | 1 | 1.8% |
Open Punctuation
Value | Count | Frequency (%) |
( | 110 |
Close Punctuation
Value | Count | Frequency (%) |
) | 110 |
Space Separator
Value | Count | Frequency (%) |
18 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 942 | |
Common | 239 | 19.3% |
Latin | 57 | 4.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
경 | 70 | 7.4% |
구 | 65 | 6.9% |
원 | 63 | 6.7% |
연 | 62 | 6.6% |
환 | 61 | 6.5% |
재 | 59 | 6.3% |
한 | 33 | 3.5% |
국 | 30 | 3.2% |
시 | 28 | 3.0% |
험 | 28 | 3.0% |
Other values (93) | 443 |
Latin
Value | Count | Frequency (%) |
I | 24 | |
T | 15 | |
F | 9 | 15.8% |
K | 3 | 5.3% |
O | 3 | 5.3% |
E | 1 | 1.8% |
H | 1 | 1.8% |
S | 1 | 1.8% |
Common
Value | Count | Frequency (%) |
( | 110 | |
) | 110 | |
18 | 7.5% | |
_ | 1 | 0.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 942 | |
ASCII | 296 | 23.9% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
( | 110 | |
) | 110 | |
I | 24 | 8.1% |
18 | 6.1% | |
T | 15 | 5.1% |
F | 9 | 3.0% |
K | 3 | 1.0% |
O | 3 | 1.0% |
E | 1 | 0.3% |
H | 1 | 0.3% |
Other values (2) | 2 | 0.7% |
Hangul
Value | Count | Frequency (%) |
경 | 70 | 7.4% |
구 | 65 | 6.9% |
원 | 63 | 6.7% |
연 | 62 | 6.6% |
환 | 61 | 6.5% |
재 | 59 | 6.3% |
한 | 33 | 3.5% |
국 | 30 | 3.2% |
시 | 28 | 3.0% |
험 | 28 | 3.0% |
Other values (93) | 443 |
분야
Categorical
Distinct | 14 |
---|---|
Distinct (%) | 14.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
수질 | |
---|---|
토양 | |
대기 | |
실내공기질 | |
환경유해인자 | |
Other values (9) |
Length
Max length | 12 |
---|---|
Median length | 2 |
Mean length | 3.06 |
Min length | 2 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 3.0% |
Sample
1st row | 환경유해인자 |
---|---|
2nd row | 수질 |
3rd row | 먹는물 |
4th row | 실내공기질 |
5th row | 실내공기질 |
Common Values
Value | Count | Frequency (%) |
수질 | 24 | |
토양 | 24 | |
대기 | 13 | |
실내공기질 | 9 | 9.0% |
환경유해인자 | 6 | 6.0% |
먹는물 | 6 | 6.0% |
폐기물 | 5 | 5.0% |
악취 | 4 | 4.0% |
복합악취 | 2 | 2.0% |
폐기물(절연유PCBs) | 2 | 2.0% |
Other values (4) | 5 | 5.0% |
Length
Value | Count | Frequency (%) |
수질 | 24 | |
토양 | 24 | |
대기 | 13 | |
실내공기질 | 9 | 9.0% |
환경유해인자 | 6 | 6.0% |
먹는물 | 6 | 6.0% |
폐기물 | 5 | 5.0% |
악취 | 4 | 4.0% |
복합악취 | 2 | 2.0% |
폐기물(절연유pcbs | 2 | 2.0% |
Other values (4) | 5 | 5.0% |
생성날짜
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
201912 |
---|
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 201912 |
---|---|
2nd row | 201912 |
3rd row | 201912 |
4th row | 201912 |
5th row | 201912 |
Common Values
Value | Count | Frequency (%) |
201912 | 100 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
201912 | 100 |
번호 | 기관명 | 분야 | |
---|---|---|---|
번호 | 1.000 | 0.989 | 0.398 |
기관명 | 0.989 | 1.000 | 0.000 |
분야 | 0.398 | 0.000 | 1.000 |
번호 | 분야 | |
---|---|---|
번호 | 1.000 | 0.151 |
분야 | 0.151 | 1.000 |
번호 | 기관명 | 분야 | 생성날짜 | |
---|---|---|---|---|
0 | 1212 | (사)KOTITI시험연구원 | 환경유해인자 | 201912 |
1 | 1210 | (사)KOTITI시험연구원 | 수질 | 201912 |
2 | 1211 | (사)KOTITI시험연구원 | 먹는물 | 201912 |
3 | 1209 | (사)대한산업보건협회 광주전남북지역본부 | 실내공기질 | 201912 |
4 | 1208 | (사)대한산업보건협회 대전충남북지역본부 | 실내공기질 | 201912 |
5 | 1207 | (사)대한산업보건협회 서울지역본부 | 실내공기질 | 201912 |
6 | 1206 | (사)대한산업보건협회 전북산업보건센터 | 실내공기질 | 201912 |
7 | 1205 | (사)대한산업안전협회 | 환경유해인자 | 201912 |
8 | 1204 | (유)대명환경법인 | 대기 | 201912 |
9 | 1202 | (유)대신환경개발 | 수질2 | 201912 |
번호 | 기관명 | 분야 | 생성날짜 | |
---|---|---|---|---|
90 | 1123 | (주)국토엔지니어링 | 토양 | 201912 |
91 | 1121 | (주)국토해양환경기술단 | 수질 | 201912 |
92 | 1119 | (주)그린비즈 | 토양누출검사 | 201912 |
93 | 1120 | (주)그린비즈 | 토양(누출) | 201912 |
94 | 1118 | (주)그린이엔지 | 수질 | 201912 |
95 | 1117 | (주)그린환경 | 대기 | 201912 |
96 | 1116 | (주)그린환경 | 악취 | 201912 |
97 | 1114 | (주)그린환경 | 토양 | 201912 |
98 | 1113 | (주)그린환경 | 수질 | 201912 |
99 | 1112 | (주)그린환경 | 실내공기질 | 201912 |