Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 332 |
Missing cells | 1 |
Missing cells (%) | 0.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 13.1 KiB |
Average record size in memory | 40.4 B |
Variable types
Text | 1 |
---|---|
Categorical | 3 |
Boolean | 1 |
Dataset
Description | 「검역법」에 따라 세계보건기구(WHO), 현지공관 등의 감염병 발생 정보를 기준으로 검역감염병 오염지역을 규정.그에 따른 검역감염병 오염국가에 대한 정보 제공. (국가, 오염감염병, 지정일, 해제일) |
---|---|
Author | 질병관리청 |
URL | https://www.data.go.kr/data/3074726/fileData.do |
지정일자 is highly overall correlated with 오염감염병 and 2 other fields | High correlation |
지속여부 is highly overall correlated with 오염감염병 and 2 other fields | High correlation |
해지일자 is highly overall correlated with 오염감염병 and 2 other fields | High correlation |
오염감염병 is highly overall correlated with 지정일자 and 2 other fields | High correlation |
오염감염병 is highly imbalanced (61.4%) | Imbalance |
지정일자 is highly imbalanced (67.8%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 05:21:02.775542 |
---|---|
Analysis finished | 2023-12-12 05:21:03.262555 |
Duration | 0.49 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
국가
Text
Distinct | 259 |
---|---|
Distinct (%) | 78.2% |
Missing | 1 |
Missing (%) | 0.3% |
Memory size | 2.7 KiB |
Value | Count | Frequency (%) |
콩고민주공화국 | 6 | 1.6% |
섬 | 5 | 1.3% |
제도 | 5 | 1.3% |
기니 | 4 | 1.0% |
세인트 | 4 | 1.0% |
에티오피아 | 4 | 1.0% |
영국령 | 4 | 1.0% |
나이지리아 | 4 | 1.0% |
지역 | 3 | 0.8% |
니제르 | 3 | 0.8% |
Other values (267) | 339 |
Most occurring characters
Value | Count | Frequency (%) |
아 | 84 | 5.8% |
50 | 3.5% | |
리 | 47 | 3.2% |
스 | 45 | 3.1% |
르 | 38 | 2.6% |
이 | 38 | 2.6% |
도 | 38 | 2.6% |
라 | 36 | 2.5% |
니 | 34 | 2.3% |
나 | 30 | 2.1% |
Other values (226) | 1008 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1379 | |
Space Separator | 50 | 3.5% |
Uppercase Letter | 7 | 0.5% |
Other Punctuation | 5 | 0.3% |
Close Punctuation | 3 | 0.2% |
Open Punctuation | 3 | 0.2% |
Dash Punctuation | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
아 | 84 | 6.1% |
리 | 47 | 3.4% |
스 | 45 | 3.3% |
르 | 38 | 2.8% |
이 | 38 | 2.8% |
도 | 38 | 2.8% |
라 | 36 | 2.6% |
니 | 34 | 2.5% |
나 | 30 | 2.2% |
트 | 27 | 2.0% |
Other values (214) | 962 |
Uppercase Letter
Value | Count | Frequency (%) |
I | 1 | |
M | 1 | |
H | 1 | |
R | 1 | |
E | 1 | |
T | 1 | |
O | 1 |
Space Separator
Value | Count | Frequency (%) |
50 |
Other Punctuation
Value | Count | Frequency (%) |
, | 5 |
Close Punctuation
Value | Count | Frequency (%) |
) | 3 |
Open Punctuation
Value | Count | Frequency (%) |
( | 3 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1379 | |
Common | 62 | 4.3% |
Latin | 7 | 0.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
아 | 84 | 6.1% |
리 | 47 | 3.4% |
스 | 45 | 3.3% |
르 | 38 | 2.8% |
이 | 38 | 2.8% |
도 | 38 | 2.8% |
라 | 36 | 2.6% |
니 | 34 | 2.5% |
나 | 30 | 2.2% |
트 | 27 | 2.0% |
Other values (214) | 962 |
Latin
Value | Count | Frequency (%) |
I | 1 | |
M | 1 | |
H | 1 | |
R | 1 | |
E | 1 | |
T | 1 | |
O | 1 |
Common
Value | Count | Frequency (%) |
50 | ||
, | 5 | 8.1% |
) | 3 | 4.8% |
( | 3 | 4.8% |
- | 1 | 1.6% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1379 | |
ASCII | 69 | 4.8% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
아 | 84 | 6.1% |
리 | 47 | 3.4% |
스 | 45 | 3.3% |
르 | 38 | 2.8% |
이 | 38 | 2.8% |
도 | 38 | 2.8% |
라 | 36 | 2.6% |
니 | 34 | 2.5% |
나 | 30 | 2.2% |
트 | 27 | 2.0% |
Other values (214) | 962 |
ASCII
Value | Count | Frequency (%) |
50 | ||
, | 5 | 7.2% |
) | 3 | 4.3% |
( | 3 | 4.3% |
I | 1 | 1.4% |
M | 1 | 1.4% |
- | 1 | 1.4% |
H | 1 | 1.4% |
R | 1 | 1.4% |
E | 1 | 1.4% |
Other values (2) | 2 | 2.9% |
오염감염병
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 8 |
---|---|
Distinct (%) | 2.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.7 KiB |
코로나19 | |
---|---|
황열 | |
중동호흡기증후군 | 11 |
폴리오 | 9 |
콜레라 | 8 |
Other values (3) | 3 |
Length
Max length | 12 |
---|---|
Median length | 5 |
Mean length | 4.6746988 |
Min length | 2 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 0.9% |
Sample
1st row | 코로나19 |
---|---|
2nd row | 코로나19 |
3rd row | 황열 |
4th row | 코로나19 |
5th row | 코로나19 |
Common Values
Value | Count | Frequency (%) |
코로나19 | 260 | |
황열 | 41 | 12.3% |
중동호흡기증후군 | 11 | 3.3% |
폴리오 | 9 | 2.7% |
콜레라 | 8 | 2.4% |
동물인플루엔자인체감염증 | 1 | 0.3% |
페스트 | 1 | 0.3% |
에볼라바이러스병 | 1 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
코로나19 | 260 | |
황열 | 41 | 12.3% |
중동호흡기증후군 | 11 | 3.3% |
폴리오 | 9 | 2.7% |
콜레라 | 8 | 2.4% |
동물인플루엔자인체감염증 | 1 | 0.3% |
페스트 | 1 | 0.3% |
에볼라바이러스병 | 1 | 0.3% |
지정일자
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 21 |
---|---|
Distinct (%) | 6.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.7 KiB |
2020-07-01 | |
---|---|
2005-05-01 | |
2019-01-01 | 7 |
2011-09-28 | 3 |
2017-02-10 | 2 |
Other values (16) | 23 |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 10 |
Min length | 10 |
Unique
Unique | 9 ? |
---|---|
Unique (%) | 2.7% |
Sample
1st row | 2020-07-01 |
---|---|
2nd row | 2020-07-01 |
3rd row | 2005-05-01 |
4th row | 2020-07-01 |
5th row | 2020-07-01 |
Common Values
Value | Count | Frequency (%) |
2020-07-01 | 257 | |
2005-05-01 | 40 | 12.0% |
2019-01-01 | 7 | 2.1% |
2011-09-28 | 3 | 0.9% |
2017-02-10 | 2 | 0.6% |
2018-01-01 | 2 | 0.6% |
2020-01-01 | 2 | 0.6% |
2020-03-11 | 2 | 0.6% |
2018-07-01 | 2 | 0.6% |
2013-05-16 | 2 | 0.6% |
Other values (11) | 13 | 3.9% |
Length
Value | Count | Frequency (%) |
2020-07-01 | 257 | |
2005-05-01 | 40 | 12.0% |
2019-01-01 | 7 | 2.1% |
2011-09-28 | 3 | 0.9% |
2018-07-01 | 2 | 0.6% |
2020-02-12 | 2 | 0.6% |
2013-05-16 | 2 | 0.6% |
2017-06-30 | 2 | 0.6% |
2020-03-11 | 2 | 0.6% |
2020-01-01 | 2 | 0.6% |
Other values (11) | 13 | 3.9% |
해지일자
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.7 KiB |
2023-07-15 | |
---|---|
9999-12-31 |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 10 |
Min length | 10 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2023-07-15 |
---|---|
2nd row | 2023-07-15 |
3rd row | 9999-12-31 |
4th row | 2023-07-15 |
5th row | 2023-07-15 |
Common Values
Value | Count | Frequency (%) |
2023-07-15 | 261 | |
9999-12-31 | 71 | 21.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2023-07-15 | 261 | |
9999-12-31 | 71 | 21.4% |
지속여부
Boolean
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 464.0 B |
False | |
---|---|
True |
Value | Count | Frequency (%) |
False | 261 | |
True | 71 | 21.4% |
오염감염병 | 지정일자 | 해지일자 | 지속여부 | |
---|---|---|---|---|
오염감염병 | 1.000 | 0.974 | 1.000 | 1.000 |
지정일자 | 0.974 | 1.000 | 0.982 | 0.982 |
해지일자 | 1.000 | 0.982 | 1.000 | 1.000 |
지속여부 | 1.000 | 0.982 | 1.000 | 1.000 |
지정일자 | 지속여부 | 해지일자 | 오염감염병 | |
---|---|---|---|---|
지정일자 | 1.000 | 0.952 | 0.952 | 0.865 |
지속여부 | 0.952 | 1.000 | 0.991 | 0.983 |
해지일자 | 0.952 | 0.991 | 1.000 | 0.983 |
오염감염병 | 0.865 | 0.983 | 0.983 | 1.000 |
오염감염병 | 지정일자 | 해지일자 | 지속여부 | |
---|---|---|---|---|
오염감염병 | 1.000 | 0.865 | 0.983 | 0.983 |
지정일자 | 0.865 | 1.000 | 0.952 | 0.952 |
해지일자 | 0.983 | 0.952 | 1.000 | 0.991 |
지속여부 | 0.983 | 0.952 | 0.991 | 1.000 |
국가 | 오염감염병 | 지정일자 | 해지일자 | 지속여부 | |
---|---|---|---|---|---|
0 | MI | 코로나19 | 2020-07-01 | 2023-07-15 | N |
1 | OTHER | 코로나19 | 2020-07-01 | 2023-07-15 | N |
2 | 가나 | 황열 | 2005-05-01 | 9999-12-31 | Y |
3 | 가나 | 코로나19 | 2020-07-01 | 2023-07-15 | N |
4 | 가봉 | 코로나19 | 2020-07-01 | 2023-07-15 | N |
5 | 가봉 | 황열 | 2005-05-01 | 9999-12-31 | Y |
6 | 가이아나 | 황열 | 2005-05-01 | 9999-12-31 | Y |
7 | 가이아나 | 코로나19 | 2020-07-01 | 2023-07-15 | N |
8 | 감비아 | 코로나19 | 2020-07-01 | 2023-07-15 | N |
9 | 과들루프 | 코로나19 | 2020-07-01 | 2023-07-15 | N |
국가 | 오염감염병 | 지정일자 | 해지일자 | 지속여부 | |
---|---|---|---|---|---|
322 | 프랑스령 폴리네시아 | 코로나19 | 2020-07-01 | 2023-07-15 | N |
323 | 피지 | 코로나19 | 2020-07-01 | 2023-07-15 | N |
324 | 핀란드 | 코로나19 | 2020-07-01 | 2023-07-15 | N |
325 | 필리핀 | 코로나19 | 2020-07-01 | 2023-07-15 | N |
326 | 핏카인도 | 코로나19 | 2020-07-01 | 2023-07-15 | N |
327 | 하드 앤 맥도날드 | 코로나19 | 2020-07-01 | 2023-07-15 | N |
328 | 헝가리 | 코로나19 | 2020-07-01 | 2023-07-15 | N |
329 | 호주 | 코로나19 | 2020-07-01 | 2023-07-15 | N |
330 | 홍콩 | 코로나19 | 2020-02-12 | 2023-07-15 | N |
331 | <NA> | 코로나19 | 2020-07-01 | 2023-07-15 | N |