Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 2557 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 145.0 KiB |
Average record size in memory | 58.1 B |
Variable types
DateTime | 1 |
---|---|
Categorical | 4 |
Boolean | 2 |
Dataset
Description | 환경신기술 업무 기준 달력 정보(2020-10-26 기준 / 일자, 요일, 주간, 월 마지막 주, 휴일여부, 휴일사유, 일요일 구분 등) |
---|---|
Author | 한국환경산업기술원 |
URL | https://www.data.go.kr/data/15071523/fileData.do |
일요일 구분 is highly overall correlated with 요일 | High correlation |
휴일사유 is highly overall correlated with 주간 and 2 other fields | High correlation |
휴일여부 is highly overall correlated with 휴일사유 | High correlation |
요일 is highly overall correlated with 일요일 구분 | High correlation |
주간 is highly overall correlated with 휴일사유 | High correlation |
월마지막주 is highly overall correlated with 휴일사유 | High correlation |
월마지막주 is highly imbalanced (69.4%) | Imbalance |
휴일여부 is highly imbalanced (81.3%) | Imbalance |
휴일사유 is highly imbalanced (93.3%) | Imbalance |
일자 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 16:37:08.134611 |
---|---|
Analysis finished | 2023-12-12 16:37:08.802657 |
Duration | 0.67 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
일자
Date
UNIQUE
 
Distinct | 2557 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.1 KiB |
Minimum | 2014-01-01 00:00:00 |
---|---|
Maximum | 2020-12-31 00:00:00 |
요일
Categorical
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.1 KiB |
수 | |
---|---|
목 | |
월 | |
화 | |
금 | |
Other values (2) |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 월 |
---|---|
2nd row | 화 |
3rd row | 수 |
4th row | 목 |
5th row | 금 |
Common Values
Value | Count | Frequency (%) |
수 | 366 | |
목 | 366 | |
월 | 365 | |
화 | 365 | |
금 | 365 | |
토 | 365 | |
일 | 365 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
수 | 366 | |
목 | 366 | |
월 | 365 | |
화 | 365 | |
금 | 365 | |
토 | 365 | |
일 | 365 |
주간
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.1 KiB |
2 | |
---|---|
3 | |
4 | |
1 | |
5 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2 |
---|---|
2nd row | 2 |
3rd row | 2 |
4th row | 2 |
5th row | 2 |
Common Values
Value | Count | Frequency (%) |
2 | 588 | |
3 | 588 | |
4 | 588 | |
1 | 588 | |
5 | 205 | 8.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2 | 588 | |
3 | 588 | |
4 | 588 | |
1 | 588 | |
5 | 205 | 8.0% |
월마지막주
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.1 KiB |
5 | |
---|---|
4 | 140 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 5 |
---|---|
2nd row | 5 |
3rd row | 5 |
4th row | 5 |
5th row | 5 |
Common Values
Value | Count | Frequency (%) |
5 | 2417 | |
4 | 140 | 5.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
5 | 2417 | |
4 | 140 | 5.5% |
휴일여부
Boolean
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.6 KiB |
False | |
---|---|
True | 73 |
Value | Count | Frequency (%) |
False | 2484 | |
True | 73 | 2.9% |
휴일사유
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 22 |
---|---|
Distinct (%) | 0.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.1 KiB |
<NA> | |
---|---|
삼일절 | 7 |
어린이날 | 7 |
현충일 | 7 |
광복절 | 7 |
Other values (17) | 45 |
Length
Max length | 9 |
---|---|
Median length | 4 |
Mean length | 3.9898318 |
Min length | 2 |
Unique
Unique | 12 ? |
---|---|
Unique (%) | 0.5% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 2484 | |
삼일절 | 7 | 0.3% |
어린이날 | 7 | 0.3% |
현충일 | 7 | 0.3% |
광복절 | 7 | 0.3% |
개천절 | 7 | 0.3% |
한글날 | 7 | 0.3% |
크리스마스 | 7 | 0.3% |
신정 | 7 | 0.3% |
석가탄신일 | 5 | 0.2% |
Other values (12) | 12 | 0.5% |
Length
Value | Count | Frequency (%) |
na | 2484 | |
어린이날 | 7 | 0.3% |
현충일 | 7 | 0.3% |
광복절 | 7 | 0.3% |
개천절 | 7 | 0.3% |
한글날 | 7 | 0.3% |
크리스마스 | 7 | 0.3% |
신정 | 7 | 0.3% |
삼일절 | 7 | 0.3% |
석가탄신일 | 5 | 0.2% |
Other values (12) | 12 | 0.5% |
일요일 구분
Boolean
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.6 KiB |
False | |
---|---|
True |
Value | Count | Frequency (%) |
False | 1832 | |
True | 725 | 28.4% |
요일 | 주간 | 월마지막주 | 휴일여부 | 휴일사유 | 일요일 구분 | |
---|---|---|---|---|---|---|
요일 | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.948 |
주간 | 0.000 | 1.000 | 0.048 | 0.087 | 1.000 | 0.000 |
월마지막주 | 0.000 | 0.048 | 1.000 | 0.000 | 1.000 | 0.000 |
휴일여부 | 0.000 | 0.087 | 0.000 | 1.000 | NaN | 0.077 |
휴일사유 | 0.000 | 1.000 | 1.000 | NaN | 1.000 | 0.000 |
일요일 구분 | 0.948 | 0.000 | 0.000 | 0.077 | 0.000 | 1.000 |
월마지막주 | 일요일 구분 | 주간 | 휴일사유 | 휴일여부 | 요일 | |
---|---|---|---|---|---|---|
월마지막주 | 1.000 | 0.000 | 0.059 | 0.856 | 0.000 | 0.000 |
일요일 구분 | 0.000 | 1.000 | 0.000 | 0.000 | 0.049 | 0.994 |
주간 | 0.059 | 0.000 | 1.000 | 0.868 | 0.107 | 0.000 |
휴일사유 | 0.856 | 0.000 | 0.868 | 1.000 | 1.000 | 0.000 |
휴일여부 | 0.000 | 0.049 | 0.107 | 1.000 | 1.000 | 0.000 |
요일 | 0.000 | 0.994 | 0.000 | 0.000 | 0.000 | 1.000 |
요일 | 주간 | 월마지막주 | 휴일여부 | 휴일사유 | 일요일 구분 | |
---|---|---|---|---|---|---|
요일 | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.994 |
주간 | 0.000 | 1.000 | 0.059 | 0.107 | 0.868 | 0.000 |
월마지막주 | 0.000 | 0.059 | 1.000 | 0.000 | 0.856 | 0.000 |
휴일여부 | 0.000 | 0.107 | 0.000 | 1.000 | 1.000 | 0.049 |
휴일사유 | 0.000 | 0.868 | 0.856 | 1.000 | 1.000 | 0.000 |
일요일 구분 | 0.994 | 0.000 | 0.000 | 0.049 | 0.000 | 1.000 |
일자 | 요일 | 주간 | 월마지막주 | 휴일여부 | 휴일사유 | 일요일 구분 | |
---|---|---|---|---|---|---|---|
0 | 2014-11-10 | 월 | 2 | 5 | N | <NA> | N |
1 | 2014-11-11 | 화 | 2 | 5 | N | <NA> | N |
2 | 2014-11-12 | 수 | 2 | 5 | N | <NA> | N |
3 | 2014-11-13 | 목 | 2 | 5 | N | <NA> | N |
4 | 2014-11-14 | 금 | 2 | 5 | N | <NA> | N |
5 | 2014-11-15 | 토 | 3 | 5 | N | <NA> | Y |
6 | 2014-11-16 | 일 | 3 | 5 | N | <NA> | Y |
7 | 2014-11-17 | 월 | 3 | 5 | N | <NA> | N |
8 | 2014-11-18 | 화 | 3 | 5 | N | <NA> | N |
9 | 2014-11-19 | 수 | 3 | 5 | N | <NA> | N |
일자 | 요일 | 주간 | 월마지막주 | 휴일여부 | 휴일사유 | 일요일 구분 | |
---|---|---|---|---|---|---|---|
2547 | 2020-12-22 | 화 | 4 | 5 | N | <NA> | N |
2548 | 2020-12-23 | 수 | 4 | 5 | N | <NA> | N |
2549 | 2020-12-24 | 목 | 4 | 5 | N | <NA> | N |
2550 | 2020-12-25 | 금 | 4 | 5 | Y | 크리스마스 | N |
2551 | 2020-12-26 | 토 | 4 | 5 | N | <NA> | Y |
2552 | 2020-12-27 | 일 | 4 | 5 | N | <NA> | Y |
2553 | 2020-12-28 | 월 | 4 | 5 | N | <NA> | N |
2554 | 2020-12-29 | 화 | 5 | 5 | N | <NA> | N |
2555 | 2020-12-30 | 수 | 5 | 5 | N | <NA> | N |
2556 | 2020-12-31 | 목 | 5 | 5 | N | <NA> | N |