Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 1121 |
Missing cells | 2214 |
Missing cells (%) | 28.2% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 64.7 KiB |
Average record size in memory | 59.1 B |
Variable types
Numeric | 3 |
---|---|
Categorical | 2 |
Text | 2 |
Dataset
Description | 경상남도 아동급식카드 가맹점 현황 |
---|---|
Author | 경상남도 |
URL | https://www.data.go.kr/data/15068650/fileData.do |
업종 is highly overall correlated with 시도 | High correlation |
시도 is highly overall correlated with 연번 and 3 other fields | High correlation |
연번 is highly overall correlated with 시도 | High correlation |
순번 is highly overall correlated with 시도 | High correlation |
개수 is highly overall correlated with 시도 | High correlation |
시도 is highly imbalanced (90.3%) | Imbalance |
연번 has 1107 (98.8%) missing values | Missing |
시군구 has 1107 (98.8%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 23:25:50.173722 |
---|---|
Analysis finished | 2023-12-12 23:25:51.682840 |
Duration | 1.51 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 14 |
---|---|
Distinct (%) | 100.0% |
Missing | 1107 |
Missing (%) | 98.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 7.5 |
Minimum | 1 |
---|---|
Maximum | 14 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 10.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1.65 |
Q1 | 4.25 |
median | 7.5 |
Q3 | 10.75 |
95-th percentile | 13.35 |
Maximum | 14 |
Range | 13 |
Interquartile range (IQR) | 6.5 |
Descriptive statistics
Standard deviation | 4.1833001 |
---|---|
Coefficient of variation (CV) | 0.55777335 |
Kurtosis | -1.2 |
Mean | 7.5 |
Median Absolute Deviation (MAD) | 3.5 |
Skewness | 0 |
Sum | 105 |
Variance | 17.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.1% |
2 | 1 | 0.1% |
3 | 1 | 0.1% |
4 | 1 | 0.1% |
5 | 1 | 0.1% |
6 | 1 | 0.1% |
7 | 1 | 0.1% |
8 | 1 | 0.1% |
9 | 1 | 0.1% |
10 | 1 | 0.1% |
Other values (4) | 4 | 0.4% |
(Missing) | 1107 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
14 | 1 | |
13 | 1 | |
12 | 1 | |
11 | 1 | |
10 | 1 | |
9 | 1 | |
8 | 1 | |
7 | 1 | |
6 | 1 | |
5 | 1 |
시도
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.9 KiB |
<NA> | |
---|---|
경남 | 14 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9750223 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 경남 |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 1107 | |
경남 | 14 | 1.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 1107 | |
경남 | 14 | 1.2% |
시군구
Text
MISSING
 
Distinct | 14 |
---|---|
Distinct (%) | 100.0% |
Missing | 1107 |
Missing (%) | 98.8% |
Memory size | 8.9 KiB |
Value | Count | Frequency (%) |
창원시 | 1 | 7.1% |
진주시 | 1 | 7.1% |
통영시 | 1 | 7.1% |
사천시 | 1 | 7.1% |
김해시 | 1 | 7.1% |
밀양시 | 1 | 7.1% |
양산시 | 1 | 7.1% |
창녕군 | 1 | 7.1% |
고성군 | 1 | 7.1% |
남해군 | 1 | 7.1% |
Other values (4) | 4 |
Most occurring characters
Value | Count | Frequency (%) |
군 | 7 | |
시 | 7 | |
창 | 3 | 7.1% |
양 | 3 | 7.1% |
해 | 2 | 4.8% |
산 | 2 | 4.8% |
주 | 1 | 2.4% |
진 | 1 | 2.4% |
함 | 1 | 2.4% |
청 | 1 | 2.4% |
Other values (14) | 14 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 42 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
군 | 7 | |
시 | 7 | |
창 | 3 | 7.1% |
양 | 3 | 7.1% |
해 | 2 | 4.8% |
산 | 2 | 4.8% |
주 | 1 | 2.4% |
진 | 1 | 2.4% |
함 | 1 | 2.4% |
청 | 1 | 2.4% |
Other values (14) | 14 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 42 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
군 | 7 | |
시 | 7 | |
창 | 3 | 7.1% |
양 | 3 | 7.1% |
해 | 2 | 4.8% |
산 | 2 | 4.8% |
주 | 1 | 2.4% |
진 | 1 | 2.4% |
함 | 1 | 2.4% |
청 | 1 | 2.4% |
Other values (14) | 14 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 42 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
군 | 7 | |
시 | 7 | |
창 | 3 | 7.1% |
양 | 3 | 7.1% |
해 | 2 | 4.8% |
산 | 2 | 4.8% |
주 | 1 | 2.4% |
진 | 1 | 2.4% |
함 | 1 | 2.4% |
청 | 1 | 2.4% |
Other values (14) | 14 |
순번
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 332 |
---|---|
Distinct (%) | 29.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 84.021409 |
Minimum | 1 |
---|---|
Maximum | 332 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 10.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 5 |
Q1 | 23 |
median | 56 |
Q3 | 115 |
95-th percentile | 276 |
Maximum | 332 |
Range | 331 |
Interquartile range (IQR) | 92 |
Descriptive statistics
Standard deviation | 82.148143 |
---|---|
Coefficient of variation (CV) | 0.97770489 |
Kurtosis | 0.94872175 |
Mean | 84.021409 |
Median Absolute Deviation (MAD) | 39 |
Skewness | 1.341166 |
Sum | 94188 |
Variance | 6748.3174 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 14 | 1.2% |
3 | 14 | 1.2% |
2 | 14 | 1.2% |
4 | 13 | 1.2% |
5 | 13 | 1.2% |
6 | 13 | 1.2% |
7 | 13 | 1.2% |
8 | 13 | 1.2% |
9 | 13 | 1.2% |
10 | 13 | 1.2% |
Other values (322) | 988 |
Value | Count | Frequency (%) |
1 | 14 | |
2 | 14 | |
3 | 14 | |
4 | 13 | |
5 | 13 | |
6 | 13 | |
7 | 13 | |
8 | 13 | |
9 | 13 | |
10 | 13 |
Value | Count | Frequency (%) |
332 | 1 | |
331 | 1 | |
330 | 1 | |
329 | 1 | |
328 | 1 | |
327 | 1 | |
326 | 1 | |
325 | 1 | |
324 | 1 | |
323 | 1 |
가맹점(업체) 명
Text
Distinct | 1005 |
---|---|
Distinct (%) | 89.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.9 KiB |
Value | Count | Frequency (%) |
씨유(cu | 16 | 1.2% |
코리아세븐 | 13 | 1.0% |
하나로마트 | 12 | 0.9% |
gs25 | 11 | 0.9% |
김밥천국 | 9 | 0.7% |
세븐일레븐 | 8 | 0.6% |
파리바게뜨 | 7 | 0.5% |
뚜레쥬르 | 7 | 0.5% |
농협 | 6 | 0.5% |
cu | 6 | 0.5% |
Other values (1077) | 1199 |
Most occurring characters
Value | Count | Frequency (%) |
점 | 263 | 3.9% |
마 | 224 | 3.3% |
트 | 209 | 3.1% |
181 | 2.7% | |
리 | 124 | 1.8% |
이 | 103 | 1.5% |
밥 | 92 | 1.4% |
스 | 90 | 1.3% |
장 | 87 | 1.3% |
식 | 86 | 1.3% |
Other values (526) | 5280 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 6194 | |
Space Separator | 181 | 2.7% |
Uppercase Letter | 116 | 1.7% |
Open Punctuation | 71 | 1.1% |
Close Punctuation | 70 | 1.0% |
Decimal Number | 61 | 0.9% |
Lowercase Letter | 20 | 0.3% |
Other Punctuation | 19 | 0.3% |
Other Symbol | 4 | 0.1% |
Math Symbol | 1 | < 0.1% |
Other values (2) | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
점 | 263 | 4.2% |
마 | 224 | 3.6% |
트 | 209 | 3.4% |
리 | 124 | 2.0% |
이 | 103 | 1.7% |
밥 | 92 | 1.5% |
스 | 90 | 1.5% |
장 | 87 | 1.4% |
식 | 86 | 1.4% |
반 | 83 | 1.3% |
Other values (480) | 4833 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 31 | |
U | 24 | |
G | 16 | |
S | 15 | |
K | 5 | 4.3% |
D | 5 | 4.3% |
T | 3 | 2.6% |
B | 3 | 2.6% |
I | 3 | 2.6% |
H | 3 | 2.6% |
Other values (5) | 8 | 6.9% |
Lowercase Letter
Value | Count | Frequency (%) |
e | 5 | |
h | 3 | |
c | 2 | 10.0% |
s | 2 | 10.0% |
k | 2 | 10.0% |
u | 1 | 5.0% |
l | 1 | 5.0% |
a | 1 | 5.0% |
b | 1 | 5.0% |
i | 1 | 5.0% |
Decimal Number
Value | Count | Frequency (%) |
2 | 20 | |
5 | 19 | |
0 | 5 | 8.2% |
4 | 5 | 8.2% |
1 | 4 | 6.6% |
9 | 3 | 4.9% |
6 | 2 | 3.3% |
3 | 2 | 3.3% |
7 | 1 | 1.6% |
Other Punctuation
Value | Count | Frequency (%) |
& | 11 | |
, | 3 | 15.8% |
. | 3 | 15.8% |
' | 2 | 10.5% |
Space Separator
Value | Count | Frequency (%) |
181 |
Open Punctuation
Value | Count | Frequency (%) |
( | 71 |
Close Punctuation
Value | Count | Frequency (%) |
) | 70 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 4 |
Math Symbol
Value | Count | Frequency (%) |
+ | 1 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 6197 | |
Common | 405 | 6.0% |
Latin | 136 | 2.0% |
Han | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
점 | 263 | 4.2% |
마 | 224 | 3.6% |
트 | 209 | 3.4% |
리 | 124 | 2.0% |
이 | 103 | 1.7% |
밥 | 92 | 1.5% |
스 | 90 | 1.5% |
장 | 87 | 1.4% |
식 | 86 | 1.4% |
반 | 83 | 1.3% |
Other values (480) | 4836 |
Latin
Value | Count | Frequency (%) |
C | 31 | |
U | 24 | |
G | 16 | |
S | 15 | |
e | 5 | 3.7% |
K | 5 | 3.7% |
D | 5 | 3.7% |
h | 3 | 2.2% |
T | 3 | 2.2% |
B | 3 | 2.2% |
Other values (16) | 26 |
Common
Value | Count | Frequency (%) |
181 | ||
( | 71 | 17.5% |
) | 70 | 17.3% |
2 | 20 | 4.9% |
5 | 19 | 4.7% |
& | 11 | 2.7% |
0 | 5 | 1.2% |
4 | 5 | 1.2% |
1 | 4 | 1.0% |
, | 3 | 0.7% |
Other values (9) | 16 | 4.0% |
Han
Value | Count | Frequency (%) |
通 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 6193 | |
ASCII | 541 | 8.0% |
None | 4 | 0.1% |
CJK | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
점 | 263 | 4.2% |
마 | 224 | 3.6% |
트 | 209 | 3.4% |
리 | 124 | 2.0% |
이 | 103 | 1.7% |
밥 | 92 | 1.5% |
스 | 90 | 1.5% |
장 | 87 | 1.4% |
식 | 86 | 1.4% |
반 | 83 | 1.3% |
Other values (479) | 4832 |
ASCII
Value | Count | Frequency (%) |
181 | ||
( | 71 | 13.1% |
) | 70 | 12.9% |
C | 31 | 5.7% |
U | 24 | 4.4% |
2 | 20 | 3.7% |
5 | 19 | 3.5% |
G | 16 | 3.0% |
S | 15 | 2.8% |
& | 11 | 2.0% |
Other values (35) | 83 |
None
Value | Count | Frequency (%) |
㈜ | 4 |
CJK
Value | Count | Frequency (%) |
通 | 1 |
개수
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 41 |
---|---|
Distinct (%) | 3.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.4183764 |
Minimum | 1 |
---|---|
Maximum | 333 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 10.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 1 |
95-th percentile | 6 |
Maximum | 333 |
Range | 332 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 18.595381 |
---|---|
Coefficient of variation (CV) | 5.4398283 |
Kurtosis | 189.95048 |
Mean | 3.4183764 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 12.807499 |
Sum | 3832 |
Variance | 345.7882 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 994 | |
2 | 35 | 3.1% |
3 | 16 | 1.4% |
5 | 9 | 0.8% |
4 | 9 | 0.8% |
8 | 5 | 0.4% |
13 | 5 | 0.4% |
14 | 4 | 0.4% |
25 | 3 | 0.3% |
9 | 3 | 0.3% |
Other values (31) | 38 | 3.4% |
Value | Count | Frequency (%) |
1 | 994 | |
2 | 35 | 3.1% |
3 | 16 | 1.4% |
4 | 9 | 0.8% |
5 | 9 | 0.8% |
6 | 3 | 0.3% |
7 | 2 | 0.2% |
8 | 5 | 0.4% |
9 | 3 | 0.3% |
10 | 2 | 0.2% |
Value | Count | Frequency (%) |
333 | 1 | |
316 | 1 | |
216 | 1 | |
180 | 1 | |
164 | 1 | |
138 | 1 | |
107 | 1 | |
104 | 1 | |
91 | 1 | |
77 | 1 |
업종
Categorical
HIGH CORRELATION
 
Distinct | 15 |
---|---|
Distinct (%) | 1.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.9 KiB |
일반음식점 | |
---|---|
마트 | |
휴게음식점 | |
소매업 | |
편의점 | 46 |
Other values (10) |
Length
Max length | 9 |
---|---|
Median length | 5 |
Mean length | 4.2033898 |
Min length | 2 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | 마트 |
---|---|
2nd row | 일반음식점 |
3rd row | 휴게음식점 |
4th row | 마트 |
5th row | 일반음식점 |
Common Values
Value | Count | Frequency (%) |
일반음식점 | 551 | |
마트 | 209 | 18.6% |
휴게음식점 | 119 | 10.6% |
소매업 | 63 | 5.6% |
편의점 | 46 | 4.1% |
일반음식점 | 37 | 3.3% |
제과점 | 35 | 3.1% |
반찬가게 | 30 | 2.7% |
숙박및음식점업 | 19 | 1.7% |
중식 | 4 | 0.4% |
Other values (5) | 8 | 0.7% |
Length
Value | Count | Frequency (%) |
일반음식점 | 588 | |
마트 | 209 | 18.6% |
휴게음식점 | 119 | 10.6% |
소매업 | 63 | 5.6% |
편의점 | 46 | 4.1% |
제과점 | 35 | 3.1% |
반찬가게 | 30 | 2.7% |
숙박및음식점업 | 19 | 1.7% |
중식 | 4 | 0.4% |
한식 | 3 | 0.3% |
Other values (4) | 5 | 0.4% |
연번 | 시군구 | 순번 | 개수 | 업종 | |
---|---|---|---|---|---|
연번 | 1.000 | 1.000 | NaN | 0.654 | 0.540 |
시군구 | 1.000 | 1.000 | NaN | 1.000 | 1.000 |
순번 | NaN | NaN | 1.000 | 0.000 | 0.276 |
개수 | 0.654 | 1.000 | 0.000 | 1.000 | 0.384 |
업종 | 0.540 | 1.000 | 0.276 | 0.384 | 1.000 |
업종 | 시도 | |
---|---|---|
업종 | 1.000 | 1.000 |
시도 | 1.000 | 1.000 |
연번 | 순번 | 개수 | 시도 | 업종 | |
---|---|---|---|---|---|
연번 | 1.000 | NaN | -0.201 | 1.000 | 0.000 |
순번 | NaN | 1.000 | -0.321 | 1.000 | 0.106 |
개수 | -0.201 | -0.321 | 1.000 | 1.000 | 0.175 |
시도 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
업종 | 0.000 | 0.106 | 0.175 | 1.000 | 1.000 |
연번 | 시도 | 시군구 | 순번 | 가맹점(업체) 명 | 개수 | 업종 | |
---|---|---|---|---|---|---|---|
0 | 1 | 경남 | 창원시 | 1 | 성일할인마트 | 1 | 마트 |
1 | <NA> | <NA> | <NA> | 2 | 한솥도시락 | 5 | 일반음식점 |
2 | <NA> | <NA> | <NA> | 3 | 려미원 | 1 | 휴게음식점 |
3 | <NA> | <NA> | <NA> | 4 | 365할인마트 | 8 | 마트 |
4 | <NA> | <NA> | <NA> | 5 | 봄내수제돈까스 | 1 | 일반음식점 |
5 | <NA> | <NA> | <NA> | 6 | 북경 | 1 | 일반음식점 |
6 | <NA> | <NA> | <NA> | 7 | 금용 | 1 | 일반음식점 |
7 | <NA> | <NA> | <NA> | 8 | 차이랑 | 1 | 일반음식점 |
8 | <NA> | <NA> | <NA> | 9 | 중화요리 | 1 | 일반음식점 |
9 | <NA> | <NA> | <NA> | 10 | 중국관 | 1 | 일반음식점 |
연번 | 시도 | 시군구 | 순번 | 가맹점(업체) 명 | 개수 | 업종 | |
---|---|---|---|---|---|---|---|
1111 | <NA> | <NA> | <NA> | 19 | 대백마트(상림점) | 1 | 마트 |
1112 | <NA> | <NA> | <NA> | 20 | 송정마트 | 1 | 마트 |
1113 | <NA> | <NA> | <NA> | 21 | 이지할인마트 | 1 | 마트 |
1114 | <NA> | <NA> | <NA> | 22 | OK포인트마트(거창점) | 1 | 마트 |
1115 | <NA> | <NA> | <NA> | 23 | 아림할인마트 | 1 | 마트 |
1116 | <NA> | <NA> | <NA> | 24 | 시장할인마트 | 1 | 마트 |
1117 | <NA> | <NA> | <NA> | 25 | 주식회사 스카이시티아림식자재 | 1 | 마트 |
1118 | <NA> | <NA> | <NA> | 26 | 거창할인마트 | 1 | 마트 |
1119 | <NA> | <NA> | <NA> | 27 | 만물식자재마트 | 1 | 마트 |
1120 | <NA> | <NA> | <NA> | 28 | 유가네닭갈비거창점 | 1 | 한식 |