Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 3.4 KiB |
Average record size in memory | 35.3 B |
Variable types
DateTime | 1 |
---|---|
Numeric | 1 |
Text | 1 |
Categorical | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 환경부산하기관 |
URL | https://www.bigdata-environment.kr/user/data_market/detail.do?id=eb889ca0-38bb-11ea-be28-4fa0eb812a46 |
생성날짜 is highly imbalanced (91.9%) | Imbalance |
Reproduction
Analysis started | 2023-12-10 12:27:03.339928 |
---|---|
Analysis finished | 2023-12-10 12:27:04.624416 |
Duration | 1.28 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
발령일
Date
Distinct | 98 |
---|---|
Distinct (%) | 98.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Minimum | 2007-02-14 00:00:00 |
---|---|
Maximum | 2011-05-13 00:00:00 |
발령회차
Real number (ℝ)
Distinct | 23 |
---|---|
Distinct (%) | 23.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 8.89 |
Minimum | 1 |
---|---|
Maximum | 23 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1.95 |
Q1 | 4 |
median | 8 |
Q3 | 13 |
95-th percentile | 18.05 |
Maximum | 23 |
Range | 22 |
Interquartile range (IQR) | 9 |
Descriptive statistics
Standard deviation | 5.6262283 |
---|---|
Coefficient of variation (CV) | 0.63287157 |
Kurtosis | -0.71092575 |
Mean | 8.89 |
Median Absolute Deviation (MAD) | 4 |
Skewness | 0.48911319 |
Sum | 889 |
Variance | 31.654444 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
6 | 11 | 11.0% |
5 | 9 | 9.0% |
2 | 9 | 9.0% |
4 | 7 | 7.0% |
12 | 6 | 6.0% |
1 | 5 | 5.0% |
3 | 5 | 5.0% |
15 | 5 | 5.0% |
14 | 5 | 5.0% |
10 | 5 | 5.0% |
Other values (13) | 33 |
Value | Count | Frequency (%) |
1 | 5 | |
2 | 9 | |
3 | 5 | |
4 | 7 | |
5 | 9 | |
6 | 11 | |
7 | 3 | 3.0% |
8 | 4 | 4.0% |
9 | 3 | 3.0% |
10 | 5 |
Value | Count | Frequency (%) |
23 | 1 | 1.0% |
22 | 1 | 1.0% |
21 | 1 | 1.0% |
20 | 1 | 1.0% |
19 | 1 | 1.0% |
18 | 3 | |
17 | 3 | |
16 | 3 | |
15 | 5 | |
14 | 5 |
황사발생지역
Text
Distinct | 79 |
---|---|
Distinct (%) | 79.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Length
Max length | 100 |
---|---|
Median length | 98 |
Mean length | 64.08 |
Min length | 2 |
Characters and Unicode
Total characters | 6408 |
---|---|
Distinct characters | 66 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 71 ? |
---|---|
Unique (%) | 71.0% |
Sample
1st row | 서울, 백령도, 경기(문산,동두천,수원), 강원(춘천,속초,철원) |
---|---|
2nd row | 광주, 흑산도, 제주(제주, 고산, 서귀포) |
3rd row | 서울, 인천,경기(문산,동두천,수원),강원(강릉,춘천,원주,대관령,속초,철원,영월),충북(충주, 청주,추풍령),대전,충남(서산),전북(군산,전주),대구,경북(안동,상주) |
4th row | 백령도 |
5th row | 서울, 백령도, 인천, 경기(문산,동두천,수원), 강원(강릉,춘천,원주,대관령,속초,동해,철원, 영월), 충북(충주, 청주, 추풍령), 대전, 충남(서산), 전북(전주, 군산), |
Value | Count | Frequency (%) |
백령도 | 62 | 5.5% |
서울 | 55 | 4.9% |
인천 | 52 | 4.6% |
충남(서산 | 46 | 4.1% |
대전 | 46 | 4.1% |
추풍령 | 38 | 3.4% |
경기(문산 | 34 | 3.0% |
수원 | 33 | 2.9% |
동두천 | 32 | 2.8% |
충북(충주 | 32 | 2.8% |
Other values (100) | 694 |
Most occurring characters
Value | Count | Frequency (%) |
, | 1204 | |
1047 | ||
( | 336 | 5.2% |
) | 308 | 4.8% |
주 | 221 | 3.4% |
원 | 217 | 3.4% |
천 | 205 | 3.2% |
령 | 184 | 2.9% |
산 | 168 | 2.6% |
충 | 151 | 2.4% |
Other values (56) | 2367 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 3509 | |
Other Punctuation | 1204 | 18.8% |
Space Separator | 1047 | 16.3% |
Open Punctuation | 336 | 5.2% |
Close Punctuation | 308 | 4.8% |
Decimal Number | 4 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 221 | 6.3% |
원 | 217 | 6.2% |
천 | 205 | 5.8% |
령 | 184 | 5.2% |
산 | 168 | 4.8% |
충 | 151 | 4.3% |
전 | 144 | 4.1% |
도 | 137 | 3.9% |
북 | 127 | 3.6% |
대 | 115 | 3.3% |
Other values (51) | 1840 |
Other Punctuation
Value | Count | Frequency (%) |
, | 1204 |
Space Separator
Value | Count | Frequency (%) |
1047 |
Open Punctuation
Value | Count | Frequency (%) |
( | 336 |
Close Punctuation
Value | Count | Frequency (%) |
) | 308 |
Decimal Number
Value | Count | Frequency (%) |
5 | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 3509 | |
Common | 2899 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 221 | 6.3% |
원 | 217 | 6.2% |
천 | 205 | 5.8% |
령 | 184 | 5.2% |
산 | 168 | 4.8% |
충 | 151 | 4.3% |
전 | 144 | 4.1% |
도 | 137 | 3.9% |
북 | 127 | 3.6% |
대 | 115 | 3.3% |
Other values (51) | 1840 |
Common
Value | Count | Frequency (%) |
, | 1204 | |
1047 | ||
( | 336 | 11.6% |
) | 308 | 10.6% |
5 | 4 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 3509 | |
ASCII | 2899 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
, | 1204 | |
1047 | ||
( | 336 | 11.6% |
) | 308 | 10.6% |
5 | 4 | 0.1% |
Hangul
Value | Count | Frequency (%) |
주 | 221 | 6.3% |
원 | 217 | 6.2% |
천 | 205 | 5.8% |
령 | 184 | 5.2% |
산 | 168 | 4.8% |
충 | 151 | 4.3% |
전 | 144 | 4.1% |
도 | 137 | 3.9% |
북 | 127 | 3.6% |
대 | 115 | 3.3% |
Other values (51) | 1840 |
생성날짜
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
20191217 | |
---|---|
201912 | 1 |
Length
Max length | 8 |
---|---|
Median length | 8 |
Mean length | 7.98 |
Min length | 6 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.0% |
Sample
1st row | 20191217 |
---|---|
2nd row | 20191217 |
3rd row | 20191217 |
4th row | 20191217 |
5th row | 20191217 |
Common Values
Value | Count | Frequency (%) |
20191217 | 99 | |
201912 | 1 | 1.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
20191217 | 99 | |
201912 | 1 | 1.0% |
발령일 | 발령회차 | 황사발생지역 | 생성날짜 | |
---|---|---|---|---|
발령일 | 1.000 | 1.000 | 0.998 | 0.000 |
발령회차 | 1.000 | 1.000 | 0.646 | 0.287 |
황사발생지역 | 0.998 | 0.646 | 1.000 | 0.000 |
생성날짜 | 0.000 | 0.287 | 0.000 | 1.000 |
발령회차 | 생성날짜 | |
---|---|---|
발령회차 | 1.000 | 0.209 |
생성날짜 | 0.209 | 1.000 |
발령일 | 발령회차 | 황사발생지역 | 생성날짜 | |
---|---|---|---|---|
0 | 2007-02-14 00:00:00 | 1 | 서울, 백령도, 경기(문산,동두천,수원), 강원(춘천,속초,철원) | 20191217 |
1 | 2007-02-23 00:00:00 | 2 | 광주, 흑산도, 제주(제주, 고산, 서귀포) | 20191217 |
2 | 2007-03-06 00:00:00 | 3 | 서울, 인천,경기(문산,동두천,수원),강원(강릉,춘천,원주,대관령,속초,철원,영월),충북(충주, 청주,추풍령),대전,충남(서산),전북(군산,전주),대구,경북(안동,상주) | 20191217 |
3 | 2007-03-25 00:00:00 | 4 | 백령도 | 20191217 |
4 | 2007-03-27 00:00:00 | 5 | 서울, 백령도, 인천, 경기(문산,동두천,수원), 강원(강릉,춘천,원주,대관령,속초,동해,철원, 영월), 충북(충주, 청주, 추풍령), 대전, 충남(서산), 전북(전주, 군산), | 20191217 |
5 | 2007-03-28 00:00:00 | 6 | 서울, 인천, 경기(문산,동두천,수원), 강원(강릉,춘천,원주,대관령,속초,동해,철원, 영월),울릉도, 충북(충주, 청주, 추풍령), 대전, 충남(서산), 전북(전주, 군산), 광 | 20191217 |
6 | 2007-03-31 00:00:00 | 7 | 서울, 백령도, 인천, 경기(문산,동두천,수원), 강원(강릉,춘천,원주,대관령,속초,동해,철원, 영월), 충북(충주, 청주, 추풍령), 대전, 충남(서산), 전북(전주, 군산), | 20191217 |
7 | 2007-04-01 00:00:00 | 8 | 서울, 백령도, 인천, 경기(문산,동두천,수원), 강원(강릉,춘천,원주,대관령,속초,동해,철원, 영월), 충북(충주, 청주, 추풍령), 대전, 충남(서산), 전북(전주, 군산), | 20191217 |
8 | 2007-04-02 00:00:00 | 9 | 서울, 백령도, 인천, 경기(문산,동두천), 강원(강릉,춘천,원주,대관령,속초,동해,철원, 영월), 충북(충주, 청주, 추풍령), 대전, 충남(서산), 전북(전주, 군산), 광주, | 20191217 |
9 | 2007-04-05 00:00:00 | 10 | 백령도 | 20191217 |
발령일 | 발령회차 | 황사발생지역 | 생성날짜 | |
---|---|---|---|---|
90 | 2011-03-22 00:00:00 | 2 | 강원(북강릉, 원주, 대관령), 충북(추풍령), 대구, 경북(울진, 안동, 포항), 울산, 경남(마산, 진주, 거창), 제주(제주, 고산) | 20191217 |
91 | 2011-04-01 00:00:00 | 3 | 백령도 | 20191217 |
92 | 2011-04-15 00:00:00 | 4 | 강원(대관령), 대구, 경북(울진,안동) | 20191217 |
93 | 2011-04-16 00:00:00 | 4 | 대구, 경북(울진, 안동, 포항), 울산 | 20191217 |
94 | 2011-05-01 00:00:00 | 5 | 서울, 백령도, 인천, 경기(수원), 강원(북강릉, 춘천, 원주, 대관령, 속초, 철원, 울릉도), 충북(청주), 대전, 충남(서산, 천안, 보령), 전북(군산, 전주), 광주, | 20191217 |
95 | 2011-05-02 00:00:00 | 5 | 서울, 백령도, 인천, 경기(수원), 강원(북강릉, 춘천, 원주, 대관령, 속초, 철원, 울릉도), 충북(청주), 대전, 충남(서산, 천안, 보령), 전북(군산, 전주, 장수), | 20191217 |
96 | 2011-05-03 00:00:00 | 5 | 서울, 백령도, 인천, 경기(수원), 강원(춘천, 원주, 대관령, 철원, 울릉도), 충북(청주), 대전, 충남(서산, 천안, 보령), 전북(군산, 전주, 장수), 광주, 전남(목포 | 20191217 |
97 | 2011-05-04 00:00:00 | 5 | 경기(수원), 강원(원주), 대전, 충남(서산, 천안, 보령), 전북(군산, 전주, 장수), 광주, 전남(목포, 여수, 완도, 진도, 흑산도), 대구, 부산, 울산, 경남(마산, | 20191217 |
98 | 2011-05-12 00:00:00 | 6 | 서울, 백령도, 인천, 경기(수원), 강원(북강릉, 춘천, 원주, 대관령 ,속초, 철원), 충북(청주), 대전, 충남(서산, 천안, 보령), 전북(군산, 전주), 광주, 전남(목포 | 20191217 |
99 | 2011-05-13 00:00:00 | 6 | 서울, 백령도, 인천, 경기(수원), 강원(북강릉, 춘천, 원주, 대관령 ,속초, 철원), 울릉도, 충북(청주), 대전, 충남(서산, 천안, 보령), 전북(군산, 전주), 광주, | 20191217 |