Dataset statistics
Number of variables | 9 |
---|---|
Number of observations | 744 |
Missing cells | 429 |
Missing cells (%) | 6.4% |
Duplicate rows | 3 |
Duplicate rows (%) | 0.4% |
Total size in memory | 53.9 KiB |
Average record size in memory | 74.2 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 4 |
DateTime | 2 |
Text | 1 |
Dataset
Description | 식중독 발생 현황 |
---|---|
Author | 경기도 |
URL | https://data.gg.go.kr/portal/data/service/selectServicePage.do?&infId=BN4K1F2O5W160B570L341178558&infSeq=1 |
발생지역명1 has constant value "" | Constant |
Dataset has 3 (0.4%) duplicate rows | Duplicates |
통계환자수 is highly overall correlated with 시군명 | High correlation |
시군명 is highly overall correlated with 통계환자수 | High correlation |
발생일자 has 134 (18.0%) missing values | Missing |
최초신고일자 has 295 (39.7%) missing values | Missing |
통계환자수 is highly skewed (γ1 = 21.23225029) | Skewed |
Reproduction
Analysis started | 2023-12-10 22:03:39.279465 |
---|---|
Analysis finished | 2023-12-10 22:03:40.118144 |
Duration | 0.84 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
집계년도
Real number (ℝ)
Distinct | 10 |
---|---|
Distinct (%) | 1.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2015.8253 |
Minimum | 2012 |
---|---|
Maximum | 2021 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.7 KiB |
Quantile statistics
Minimum | 2012 |
---|---|
5-th percentile | 2012 |
Q1 | 2014 |
median | 2016 |
Q3 | 2018 |
95-th percentile | 2020.85 |
Maximum | 2021 |
Range | 9 |
Interquartile range (IQR) | 4 |
Descriptive statistics
Standard deviation | 2.6027434 |
---|---|
Coefficient of variation (CV) | 0.0012911553 |
Kurtosis | -0.88636896 |
Mean | 2015.8253 |
Median Absolute Deviation (MAD) | 2 |
Skewness | 0.27358194 |
Sum | 1499774 |
Variance | 6.7742731 |
Monotonicity | Decreasing |
Value | Count | Frequency (%) |
2015 | 102 | |
2014 | 100 | |
2016 | 97 | |
2012 | 90 | |
2018 | 77 | |
2017 | 73 | |
2013 | 71 | |
2019 | 56 | |
2020 | 40 | 5.4% |
2021 | 38 | 5.1% |
Value | Count | Frequency (%) |
2012 | 90 | |
2013 | 71 | |
2014 | 100 | |
2015 | 102 | |
2016 | 97 | |
2017 | 73 | |
2018 | 77 | |
2019 | 56 | |
2020 | 40 | 5.4% |
2021 | 38 | 5.1% |
Value | Count | Frequency (%) |
2021 | 38 | 5.1% |
2020 | 40 | 5.4% |
2019 | 56 | |
2018 | 77 | |
2017 | 73 | |
2016 | 97 | |
2015 | 102 | |
2014 | 100 | |
2013 | 71 | |
2012 | 90 |
시군명
Categorical
HIGH CORRELATION
 
Distinct | 31 |
---|---|
Distinct (%) | 4.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.9 KiB |
용인시 | |
---|---|
수원시 | |
부천시 | |
화성시 | |
안산시 | |
Other values (26) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.0524194 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 고양시 |
---|---|
2nd row | 고양시 |
3rd row | 고양시 |
4th row | 광명시 |
5th row | 광명시 |
Common Values
Value | Count | Frequency (%) |
용인시 | 83 | 11.2% |
수원시 | 80 | 10.8% |
부천시 | 60 | 8.1% |
화성시 | 57 | 7.7% |
안산시 | 50 | 6.7% |
김포시 | 39 | 5.2% |
평택시 | 37 | 5.0% |
성남시 | 36 | 4.8% |
고양시 | 33 | 4.4% |
남양주시 | 27 | 3.6% |
Other values (21) | 242 |
Length
Value | Count | Frequency (%) |
용인시 | 83 | 11.2% |
수원시 | 80 | 10.8% |
부천시 | 60 | 8.1% |
화성시 | 57 | 7.7% |
안산시 | 50 | 6.7% |
김포시 | 39 | 5.2% |
평택시 | 37 | 5.0% |
성남시 | 36 | 4.8% |
고양시 | 33 | 4.4% |
남양주시 | 27 | 3.6% |
Other values (21) | 242 |
발생일자
Date
MISSING
 
Distinct | 506 |
---|---|
Distinct (%) | 83.0% |
Missing | 134 |
Missing (%) | 18.0% |
Memory size | 5.9 KiB |
Minimum | 2012-01-11 00:00:00 |
---|---|
Maximum | 2018-12-10 00:00:00 |
최초신고일자
Date
MISSING
 
Distinct | 360 |
---|---|
Distinct (%) | 80.2% |
Missing | 295 |
Missing (%) | 39.7% |
Memory size | 5.9 KiB |
Minimum | 2014-01-03 00:00:00 |
---|---|
Maximum | 2018-12-11 00:00:00 |
발생지역명1
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.9 KiB |
경기 |
---|
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 경기 |
---|---|
2nd row | 경기 |
3rd row | 경기 |
4th row | 경기 |
5th row | 경기 |
Common Values
Value | Count | Frequency (%) |
경기 | 744 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
경기 | 744 |
발생지역명2
Text
Distinct | 77 |
---|---|
Distinct (%) | 10.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.9 KiB |
Value | Count | Frequency (%) |
경기 | 654 | |
용인 | 83 | 5.4% |
수원 | 79 | 5.2% |
부천 | 60 | 3.9% |
화성 | 52 | 3.4% |
안산 | 50 | 3.3% |
김포 | 39 | 2.6% |
성남 | 36 | 2.4% |
고양 | 33 | 2.2% |
평택 | 30 | 2.0% |
Other values (47) | 408 |
Most occurring characters
Value | Count | Frequency (%) |
780 | ||
기 | 664 | |
경 | 654 | |
천 | 109 | 2.8% |
안 | 104 | 2.7% |
인 | 103 | 2.6% |
양 | 102 | 2.6% |
성 | 102 | 2.6% |
수 | 91 | 2.3% |
원 | 90 | 2.3% |
Other values (57) | 1117 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 3116 | |
Space Separator | 780 | 19.9% |
Close Punctuation | 10 | 0.3% |
Open Punctuation | 10 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 664 | |
경 | 654 | |
천 | 109 | 3.5% |
안 | 104 | 3.3% |
인 | 103 | 3.3% |
양 | 102 | 3.3% |
성 | 102 | 3.3% |
수 | 91 | 2.9% |
원 | 90 | 2.9% |
부 | 84 | 2.7% |
Other values (54) | 1013 |
Space Separator
Value | Count | Frequency (%) |
780 |
Close Punctuation
Value | Count | Frequency (%) |
) | 10 |
Open Punctuation
Value | Count | Frequency (%) |
( | 10 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 3116 | |
Common | 800 | 20.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 664 | |
경 | 654 | |
천 | 109 | 3.5% |
안 | 104 | 3.3% |
인 | 103 | 3.3% |
양 | 102 | 3.3% |
성 | 102 | 3.3% |
수 | 91 | 2.9% |
원 | 90 | 2.9% |
부 | 84 | 2.7% |
Other values (54) | 1013 |
Common
Value | Count | Frequency (%) |
780 | ||
) | 10 | 1.2% |
( | 10 | 1.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 3116 | |
ASCII | 800 | 20.4% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
780 | ||
) | 10 | 1.2% |
( | 10 | 1.2% |
Hangul
Value | Count | Frequency (%) |
기 | 664 | |
경 | 654 | |
천 | 109 | 3.5% |
안 | 104 | 3.3% |
인 | 103 | 3.3% |
양 | 102 | 3.3% |
성 | 102 | 3.3% |
수 | 91 | 2.9% |
원 | 90 | 2.9% |
부 | 84 | 2.7% |
Other values (54) | 1013 |
통계자료원인시설구분명
Categorical
Distinct | 7 |
---|---|
Distinct (%) | 0.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.9 KiB |
음식점 | |
---|---|
기타 | |
학교 외 집단급식 | |
학교급식 | |
불명 | 40 |
Other values (2) | 28 |
Length
Max length | 9 |
---|---|
Median length | 3 |
Mean length | 3.4663978 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 음식점 |
---|---|
2nd row | 음식점 |
3rd row | 기타 |
4th row | 기타 |
5th row | 음식점 |
Common Values
Value | Count | Frequency (%) |
음식점 | 430 | |
기타 | 112 | 15.1% |
학교 외 집단급식 | 75 | 10.1% |
학교급식 | 59 | 7.9% |
불명 | 40 | 5.4% |
가정집 | 18 | 2.4% |
학교 | 10 | 1.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
음식점 | 430 | |
기타 | 112 | 12.5% |
학교 | 85 | 9.5% |
외 | 75 | 8.4% |
집단급식 | 75 | 8.4% |
학교급식 | 59 | 6.6% |
불명 | 40 | 4.5% |
가정집 | 18 | 2.0% |
통계원인물질역학결과내역
Categorical
Distinct | 19 |
---|---|
Distinct (%) | 2.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.9 KiB |
불검출 | |
---|---|
불명 | |
노로바이러스 | |
병원성대장균 | |
살모넬라 | |
Other values (14) |
Length
Max length | 15 |
---|---|
Median length | 14 |
Mean length | 4.1518817 |
Min length | 2 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 0.5% |
Sample
1st row | 살모넬라 |
---|---|
2nd row | 살모넬라 |
3rd row | 리스테리아 모노사이토제네스 |
4th row | 노로바이러스 |
5th row | 살모넬라 |
Common Values
Value | Count | Frequency (%) |
불검출 | 189 | |
불명 | 149 | |
노로바이러스 | 141 | |
병원성대장균 | 68 | 9.1% |
살모넬라 | 43 | 5.8% |
퍼프린젠스 | 43 | 5.8% |
원충 | 33 | 4.4% |
캠필로박터제주니 | 30 | 4.0% |
진행중 | 13 | 1.7% |
장염비브리오 | 10 | 1.3% |
Other values (9) | 25 | 3.4% |
Length
Value | Count | Frequency (%) |
불검출 | 189 | |
불명 | 149 | |
노로바이러스 | 142 | |
병원성대장균 | 68 | 9.1% |
살모넬라 | 43 | 5.8% |
퍼프린젠스 | 43 | 5.8% |
원충 | 33 | 4.4% |
캠필로박터제주니 | 30 | 4.0% |
진행중 | 13 | 1.7% |
장염비브리오 | 10 | 1.3% |
Other values (11) | 27 | 3.6% |
통계환자수
Real number (ℝ)
HIGH CORRELATION
  SKEWED
 
Distinct | 93 |
---|---|
Distinct (%) | 12.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 22.719086 |
Minimum | 2 |
---|---|
Maximum | 2975 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.7 KiB |
Quantile statistics
Minimum | 2 |
---|---|
5-th percentile | 2 |
Q1 | 3 |
median | 6 |
Q3 | 17 |
95-th percentile | 72.7 |
Maximum | 2975 |
Range | 2973 |
Interquartile range (IQR) | 14 |
Descriptive statistics
Standard deviation | 119.46461 |
---|---|
Coefficient of variation (CV) | 5.258337 |
Kurtosis | 509.41261 |
Mean | 22.719086 |
Median Absolute Deviation (MAD) | 3 |
Skewness | 21.23225 |
Sum | 16903 |
Variance | 14271.793 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
3 | 123 | |
2 | 98 | |
4 | 85 | 11.4% |
6 | 70 | 9.4% |
5 | 62 | 8.3% |
7 | 18 | 2.4% |
12 | 17 | 2.3% |
8 | 16 | 2.2% |
17 | 15 | 2.0% |
11 | 12 | 1.6% |
Other values (83) | 228 |
Value | Count | Frequency (%) |
2 | 98 | |
3 | 123 | |
4 | 85 | |
5 | 62 | |
6 | 70 | |
7 | 18 | 2.4% |
8 | 16 | 2.2% |
9 | 11 | 1.5% |
10 | 10 | 1.3% |
11 | 12 | 1.6% |
Value | Count | Frequency (%) |
2975 | 1 | |
1001 | 1 | |
356 | 1 | |
330 | 1 | |
305 | 1 | |
291 | 1 | |
263 | 1 | |
211 | 1 | |
192 | 1 | |
188 | 1 |
집계년도 | 시군명 | 발생지역명2 | 통계자료원인시설구분명 | 통계원인물질역학결과내역 | 통계환자수 | |
---|---|---|---|---|---|---|
집계년도 | 1.000 | 0.357 | 0.663 | 0.348 | 0.637 | 0.000 |
시군명 | 0.357 | 1.000 | 1.000 | 0.253 | 0.343 | 0.819 |
발생지역명2 | 0.663 | 1.000 | 1.000 | 0.494 | 0.000 | 0.814 |
통계자료원인시설구분명 | 0.348 | 0.253 | 0.494 | 1.000 | 0.518 | 0.100 |
통계원인물질역학결과내역 | 0.637 | 0.343 | 0.000 | 0.518 | 1.000 | 0.000 |
통계환자수 | 0.000 | 0.819 | 0.814 | 0.100 | 0.000 | 1.000 |
통계자료원인시설구분명 | 통계원인물질역학결과내역 | 시군명 | |
---|---|---|---|
통계자료원인시설구분명 | 1.000 | 0.258 | 0.106 |
통계원인물질역학결과내역 | 0.258 | 1.000 | 0.097 |
시군명 | 0.106 | 0.097 | 1.000 |
집계년도 | 통계환자수 | 시군명 | 통계자료원인시설구분명 | 통계원인물질역학결과내역 | |
---|---|---|---|---|---|
집계년도 | 1.000 | 0.100 | 0.143 | 0.224 | 0.292 |
통계환자수 | 0.100 | 1.000 | 0.571 | 0.069 | 0.000 |
시군명 | 0.143 | 0.571 | 1.000 | 0.106 | 0.097 |
통계자료원인시설구분명 | 0.224 | 0.069 | 0.106 | 1.000 | 0.258 |
통계원인물질역학결과내역 | 0.292 | 0.000 | 0.097 | 0.258 | 1.000 |
집계년도 | 시군명 | 발생일자 | 최초신고일자 | 발생지역명1 | 발생지역명2 | 통계자료원인시설구분명 | 통계원인물질역학결과내역 | 통계환자수 | |
---|---|---|---|---|---|---|---|---|---|
0 | 2021 | 고양시 | <NA> | <NA> | 경기 | 경기 고양 | 음식점 | 살모넬라 | 106 |
1 | 2021 | 고양시 | <NA> | <NA> | 경기 | 경기 고양 | 음식점 | 살모넬라 | 5 |
2 | 2021 | 고양시 | <NA> | <NA> | 경기 | 경기 고양 | 기타 | 리스테리아 모노사이토제네스 | 17 |
3 | 2021 | 광명시 | <NA> | <NA> | 경기 | 경기 광명 | 기타 | 노로바이러스 | 6 |
4 | 2021 | 광명시 | <NA> | <NA> | 경기 | 경기 광명 | 음식점 | 살모넬라 | 2 |
5 | 2021 | 광주시 | <NA> | <NA> | 경기 | 경기 광주 | 학교 외 집단급식 | 병원성대장균 | 19 |
6 | 2021 | 광주시 | <NA> | <NA> | 경기 | 경기 광주 | 음식점 | 불명 | 10 |
7 | 2021 | 군포시 | <NA> | <NA> | 경기 | 경기 군포 | 기타 | 살모넬라 | 4 |
8 | 2021 | 남양주시 | <NA> | <NA> | 경기 | 경기 남양주 | 학교 | 클로스트리디움퍼프린젠스 | 46 |
9 | 2021 | 성남시 | <NA> | <NA> | 경기 | 경기 성남 | 음식점 | 살모넬라 | 192 |
집계년도 | 시군명 | 발생일자 | 최초신고일자 | 발생지역명1 | 발생지역명2 | 통계자료원인시설구분명 | 통계원인물질역학결과내역 | 통계환자수 | |
---|---|---|---|---|---|---|---|---|---|
734 | 2012 | 의정부시 | 2012-06-09 | <NA> | 경기 | 의정부 | 음식점 | 살모넬라 | 10 |
735 | 2012 | 이천시 | 2012-12-24 | <NA> | 경기 | 이천 | 음식점 | 노로바이러스 | 21 |
736 | 2012 | 파주시 | 2012-08-08 | <NA> | 경기 | 파주 | 음식점 | 불검출 | 5 |
737 | 2012 | 평택시 | 2012-05-17 | <NA> | 경기 | 평택 | 불명 | 불검출 | 12 |
738 | 2012 | 포천시 | 2012-09-10 | <NA> | 경기 | 포천 | 기타 | 진행중 | 4 |
739 | 2012 | 화성시 | 2012-12-27 | <NA> | 경기 | 화성 | 음식점 | 진행중 | 4 |
740 | 2012 | 화성시 | 2012-12-07 | <NA> | 경기 | 화성 | 음식점 | 불검출 | 22 |
741 | 2012 | 화성시 | 2012-12-03 | <NA> | 경기 | 화성 | 음식점 | 불검출 | 6 |
742 | 2012 | 화성시 | 2012-09-09 | <NA> | 경기 | 화성 | 음식점 | 장염비브리오 | 3 |
743 | 2012 | 화성시 | 2012-02-20 | <NA> | 경기 | 화성 | 음식점 | 불검출 | 8 |
Most frequently occurring
집계년도 | 시군명 | 발생일자 | 최초신고일자 | 발생지역명1 | 발생지역명2 | 통계자료원인시설구분명 | 통계원인물질역학결과내역 | 통계환자수 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|---|
0 | 2016 | 김포시 | 2016-04-20 | 2016-04-21 | 경기 | 경기 김포 | 음식점 | 원충 | 3 | 2 |
1 | 2019 | 화성시 | <NA> | <NA> | 경기 | 경기 화성 | 학교 외 집단급식 | 노로바이러스 | 17 | 2 |
2 | 2020 | 용인시 | <NA> | <NA> | 경기 | 경기 용인 | 음식점 | 불명 | 6 | 2 |