Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 676 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 27.2 KiB |
Average record size in memory | 41.2 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 3 |
Text | 1 |
Dataset
Description | 한국환경산업기술원 친환경소비분석시스템(greencrm.keiti.re.kr)에서 제공하는 그린카드 공공부문 유료시설 할인혜택에 대해 23년 1월 기준('23.1.28.) 정리한 데이터 |
---|---|
URL | https://www.data.go.kr/data/15089158/fileData.do |
번호 is highly overall correlated with 구분 and 1 other fields | High correlation |
구분 is highly overall correlated with 번호 and 1 other fields | High correlation |
지역 is highly overall correlated with 번호 and 1 other fields | High correlation |
구분 is highly imbalanced (60.0%) | Imbalance |
번호 has unique values | Unique |
공공시설명 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 06:13:14.231760 |
---|---|
Analysis finished | 2023-12-12 06:13:14.906905 |
Duration | 0.68 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 676 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 338.5 |
Minimum | 1 |
---|---|
Maximum | 676 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.1 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 34.75 |
Q1 | 169.75 |
median | 338.5 |
Q3 | 507.25 |
95-th percentile | 642.25 |
Maximum | 676 |
Range | 675 |
Interquartile range (IQR) | 337.5 |
Descriptive statistics
Standard deviation | 195.28868 |
---|---|
Coefficient of variation (CV) | 0.57692371 |
Kurtosis | -1.2 |
Mean | 338.5 |
Median Absolute Deviation (MAD) | 169 |
Skewness | 0 |
Sum | 228826 |
Variance | 38137.667 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.1% |
456 | 1 | 0.1% |
448 | 1 | 0.1% |
449 | 1 | 0.1% |
450 | 1 | 0.1% |
451 | 1 | 0.1% |
452 | 1 | 0.1% |
453 | 1 | 0.1% |
454 | 1 | 0.1% |
455 | 1 | 0.1% |
Other values (666) | 666 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
676 | 1 | |
675 | 1 | |
674 | 1 | |
673 | 1 | |
672 | 1 | |
671 | 1 | |
670 | 1 | |
669 | 1 | |
668 | 1 | |
667 | 1 |
구분
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.4 KiB |
지자체공공시설 | |
---|---|
국립공원 | |
국립휴양림 | 39 |
국립기관 | 2 |
Length
Max length | 7 |
---|---|
Median length | 7 |
Mean length | 6.5828402 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 국립기관 |
---|---|
2nd row | 국립기관 |
3rd row | 국립휴양림 |
4th row | 국립휴양림 |
5th row | 국립휴양림 |
Common Values
Value | Count | Frequency (%) |
지자체공공시설 | 569 | |
국립공원 | 66 | 9.8% |
국립휴양림 | 39 | 5.8% |
국립기관 | 2 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
지자체공공시설 | 569 | |
국립공원 | 66 | 9.8% |
국립휴양림 | 39 | 5.8% |
국립기관 | 2 | 0.3% |
지역
Categorical
HIGH CORRELATION
 
Distinct | 23 |
---|---|
Distinct (%) | 3.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.4 KiB |
경기 | |
---|---|
경남 | |
강원 | |
전남 | |
서울 | |
Other values (18) |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.1612426 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | 경상북도 |
---|---|
2nd row | 충청남도 |
3rd row | 강원도 |
4th row | 강원도 |
5th row | 강원도 |
Common Values
Value | Count | Frequency (%) |
경기 | 97 | |
경남 | 64 | 9.5% |
강원 | 57 | 8.4% |
전남 | 48 | 7.1% |
서울 | 46 | 6.8% |
충북 | 34 | 5.0% |
경상도 | 32 | 4.7% |
경북 | 32 | 4.7% |
충남 | 31 | 4.6% |
제주 | 30 | 4.4% |
Other values (13) | 205 |
Length
Value | Count | Frequency (%) |
경기 | 97 | |
경남 | 64 | 9.5% |
강원 | 57 | 8.4% |
전남 | 48 | 7.1% |
서울 | 46 | 6.8% |
충북 | 34 | 5.0% |
경상도 | 32 | 4.7% |
경북 | 32 | 4.7% |
충남 | 31 | 4.6% |
제주 | 30 | 4.4% |
Other values (13) | 205 |
공공시설명
Text
UNIQUE
 
Distinct | 676 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.4 KiB |
Length
Max length | 29 |
---|---|
Median length | 22 |
Mean length | 8.4423077 |
Min length | 3 |
Characters and Unicode
Total characters | 5707 |
---|---|
Distinct characters | 388 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 676 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 국립낙동강생물자원관 |
---|---|
2nd row | 서천국립생태원 |
3rd row | 가리왕산 국립휴양림 |
4th row | 검봉산 국립휴양림 |
5th row | 대관령 국립휴양림 |
Value | Count | Frequency (%) |
국립휴양림 | 39 | 4.0% |
주차장 | 25 | 2.6% |
자동차야영장 | 20 | 2.1% |
제 | 8 | 0.8% |
청소년수련관 | 7 | 0.7% |
여성회관 | 6 | 0.6% |
점용면적야영장 | 5 | 0.5% |
일반야영장 | 5 | 0.5% |
북구 | 4 | 0.4% |
체육센터 | 4 | 0.4% |
Other values (772) | 848 |
Most occurring characters
Value | Count | Frequency (%) |
295 | 5.2% | |
관 | 258 | 4.5% |
장 | 151 | 2.6% |
산 | 117 | 2.1% |
센 | 115 | 2.0% |
터 | 114 | 2.0% |
체 | 105 | 1.8% |
국 | 104 | 1.8% |
시 | 100 | 1.8% |
주 | 98 | 1.7% |
Other values (378) | 4250 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 5357 | |
Space Separator | 295 | 5.2% |
Decimal Number | 18 | 0.3% |
Open Punctuation | 12 | 0.2% |
Close Punctuation | 12 | 0.2% |
Uppercase Letter | 8 | 0.1% |
Other Punctuation | 4 | 0.1% |
Dash Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
관 | 258 | 4.8% |
장 | 151 | 2.8% |
산 | 117 | 2.2% |
센 | 115 | 2.1% |
터 | 114 | 2.1% |
체 | 105 | 2.0% |
국 | 104 | 1.9% |
시 | 100 | 1.9% |
주 | 98 | 1.8% |
영 | 93 | 1.7% |
Other values (359) | 4102 |
Decimal Number
Value | Count | Frequency (%) |
2 | 5 | |
1 | 4 | |
3 | 3 | |
5 | 3 | |
6 | 1 | 5.6% |
4 | 1 | 5.6% |
0 | 1 | 5.6% |
Uppercase Letter
Value | Count | Frequency (%) |
D | 2 | |
M | 2 | |
Z | 2 | |
N | 1 | |
G | 1 |
Other Punctuation
Value | Count | Frequency (%) |
, | 2 | |
/ | 1 | |
. | 1 |
Space Separator
Value | Count | Frequency (%) |
295 |
Open Punctuation
Value | Count | Frequency (%) |
( | 12 |
Close Punctuation
Value | Count | Frequency (%) |
) | 12 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 5357 | |
Common | 342 | 6.0% |
Latin | 8 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
관 | 258 | 4.8% |
장 | 151 | 2.8% |
산 | 117 | 2.2% |
센 | 115 | 2.1% |
터 | 114 | 2.1% |
체 | 105 | 2.0% |
국 | 104 | 1.9% |
시 | 100 | 1.9% |
주 | 98 | 1.8% |
영 | 93 | 1.7% |
Other values (359) | 4102 |
Common
Value | Count | Frequency (%) |
295 | ||
( | 12 | 3.5% |
) | 12 | 3.5% |
2 | 5 | 1.5% |
1 | 4 | 1.2% |
3 | 3 | 0.9% |
5 | 3 | 0.9% |
, | 2 | 0.6% |
6 | 1 | 0.3% |
/ | 1 | 0.3% |
Other values (4) | 4 | 1.2% |
Latin
Value | Count | Frequency (%) |
D | 2 | |
M | 2 | |
Z | 2 | |
N | 1 | |
G | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 5357 | |
ASCII | 350 | 6.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
295 | ||
( | 12 | 3.4% |
) | 12 | 3.4% |
2 | 5 | 1.4% |
1 | 4 | 1.1% |
3 | 3 | 0.9% |
5 | 3 | 0.9% |
D | 2 | 0.6% |
M | 2 | 0.6% |
Z | 2 | 0.6% |
Other values (9) | 10 | 2.9% |
Hangul
Value | Count | Frequency (%) |
관 | 258 | 4.8% |
장 | 151 | 2.8% |
산 | 117 | 2.2% |
센 | 115 | 2.1% |
터 | 114 | 2.1% |
체 | 105 | 2.0% |
국 | 104 | 1.9% |
시 | 100 | 1.9% |
주 | 98 | 1.8% |
영 | 93 | 1.7% |
Other values (359) | 4102 |
할인정보(할인율 또는 할인가)
Categorical
Distinct | 17 |
---|---|
Distinct (%) | 2.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.4 KiB |
10% | |
---|---|
100% | |
50% | |
5% | |
20% | |
Other values (12) |
Length
Max length | 5 |
---|---|
Median length | 3 |
Mean length | 3.158284 |
Min length | 2 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 0.6% |
Sample
1st row | 30% |
---|---|
2nd row | 30% |
3rd row | 100% |
4th row | 100% |
5th row | 100% |
Common Values
Value | Count | Frequency (%) |
10% | 192 | |
100% | 145 | |
50% | 125 | |
5% | 80 | |
20% | 46 | 6.8% |
30% | 34 | 5.0% |
3000원 | 20 | 3.0% |
3% | 13 | 1.9% |
2000원 | 6 | 0.9% |
33% | 5 | 0.7% |
Other values (7) | 10 | 1.5% |
Length
Value | Count | Frequency (%) |
10 | 192 | |
100 | 145 | |
50 | 125 | |
5 | 80 | |
20 | 46 | 6.8% |
30 | 34 | 5.0% |
3000원 | 20 | 3.0% |
3 | 13 | 1.9% |
2000원 | 6 | 0.9% |
33 | 5 | 0.7% |
Other values (7) | 10 | 1.5% |
번호 | 구분 | 지역 | 할인정보(할인율 또는 할인가) | |
---|---|---|---|---|
번호 | 1.000 | 0.776 | 0.971 | 0.631 |
구분 | 0.776 | 1.000 | 0.945 | 0.681 |
지역 | 0.971 | 0.945 | 1.000 | 0.680 |
할인정보(할인율 또는 할인가) | 0.631 | 0.681 | 0.680 | 1.000 |
지역 | 할인정보(할인율 또는 할인가) | 구분 | |
---|---|---|---|
지역 | 1.000 | 0.267 | 0.815 |
할인정보(할인율 또는 할인가) | 0.267 | 1.000 | 0.449 |
구분 | 0.815 | 0.449 | 1.000 |
번호 | 구분 | 지역 | 할인정보(할인율 또는 할인가) | |
---|---|---|---|---|
번호 | 1.000 | 0.589 | 0.836 | 0.303 |
구분 | 0.589 | 1.000 | 0.815 | 0.449 |
지역 | 0.836 | 0.815 | 1.000 | 0.267 |
할인정보(할인율 또는 할인가) | 0.303 | 0.449 | 0.267 | 1.000 |
번호 | 구분 | 지역 | 공공시설명 | 할인정보(할인율 또는 할인가) | |
---|---|---|---|---|---|
0 | 1 | 국립기관 | 경상북도 | 국립낙동강생물자원관 | 30% |
1 | 2 | 국립기관 | 충청남도 | 서천국립생태원 | 30% |
2 | 3 | 국립휴양림 | 강원도 | 가리왕산 국립휴양림 | 100% |
3 | 4 | 국립휴양림 | 강원도 | 검봉산 국립휴양림 | 100% |
4 | 5 | 국립휴양림 | 강원도 | 대관령 국립휴양림 | 100% |
5 | 6 | 국립휴양림 | 강원도 | 두타산 국립휴양림 | 100% |
6 | 7 | 국립휴양림 | 강원도 | 미천골 국립휴양림 | 100% |
7 | 8 | 국립휴양림 | 강원도 | 방태산 국립휴양림 | 100% |
8 | 9 | 국립휴양림 | 강원도 | 백운산 국립휴양림 | 100% |
9 | 10 | 국립휴양림 | 강원도 | 복주산 국립휴양림 | 100% |
번호 | 구분 | 지역 | 공공시설명 | 할인정보(할인율 또는 할인가) | |
---|---|---|---|---|---|
666 | 667 | 지자체공공시설 | 충북 | 진천종박물관 | 50% |
667 | 668 | 지자체공공시설 | 충북 | 진천화랑관 | 50% |
668 | 669 | 지자체공공시설 | 충북 | 문의문화재단지 | 100% |
669 | 670 | 지자체공공시설 | 충북 | 청원국민체육센터 | 10% |
670 | 671 | 지자체공공시설 | 충북 | 청주랜드관리사업소 | 100% |
671 | 672 | 지자체공공시설 | 충북 | 청주실내수영장 | 10% |
672 | 673 | 지자체공공시설 | 충북 | 충주고구려천문과학관 | 30% |
673 | 674 | 지자체공공시설 | 충북 | 수안보인공암벽장 | 30% |
674 | 675 | 지자체공공시설 | 충북 | 충주자연생태체험관 | 50% |
675 | 676 | 지자체공공시설 | 충북 | 중앙탑사적공원 | 100% |