Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 501 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 33.4 KiB |
Average record size in memory | 68.3 B |
Variable types
Categorical | 3 |
---|---|
Text | 1 |
Numeric | 4 |
Dataset
Description | 2021년 국가금연지원서비스를 제공하는 인력 현황 데이터로 상담사, 지도원 등의 항목을 제공합니다.- 전국 보건소, 지역금연지원센터 |
---|---|
Author | 한국건강증진개발원 |
URL | https://www.data.go.kr/data/15092414/fileData.do |
최종학력(고등학교 이하) is highly overall correlated with 인력구분 | High correlation |
최종학력(대학교) is highly overall correlated with 기관유형 | High correlation |
최종학력(대학원) is highly overall correlated with 기관유형 | High correlation |
기관유형 is highly overall correlated with 최종학력(대학교) and 1 other fields | High correlation |
인력구분 is highly overall correlated with 최종학력(고등학교 이하) | High correlation |
기관유형 is highly imbalanced (78.6%) | Imbalance |
최종학력(고등학교 이하) has 327 (65.3%) zeros | Zeros |
최종학력(전문대) has 237 (47.3%) zeros | Zeros |
최종학력(대학교) has 104 (20.8%) zeros | Zeros |
최종학력(대학원) has 428 (85.4%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 04:29:15.590950 |
---|---|
Analysis finished | 2023-12-12 04:29:18.502938 |
Duration | 2.91 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
기관유형
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
보건소 | |
---|---|
금연지원센터 | 17 |
Length
Max length | 6 |
---|---|
Median length | 3 |
Mean length | 3.1017964 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 보건소 |
---|---|
2nd row | 보건소 |
3rd row | 보건소 |
4th row | 보건소 |
5th row | 보건소 |
Common Values
Value | Count | Frequency (%) |
보건소 | 484 | |
금연지원센터 | 17 | 3.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
보건소 | 484 | |
금연지원센터 | 17 | 3.4% |
지역
Categorical
Distinct | 17 |
---|---|
Distinct (%) | 3.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
경기도 | |
---|---|
경상북도 | |
전라남도 | |
경상남도 | |
서울특별시 | |
Other values (12) |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 4.1237525 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울특별시 |
---|---|
2nd row | 서울특별시 |
3rd row | 서울특별시 |
4th row | 서울특별시 |
5th row | 서울특별시 |
Common Values
Value | Count | Frequency (%) |
경기도 | 85 | |
경상북도 | 49 | |
전라남도 | 45 | |
경상남도 | 41 | |
서울특별시 | 40 | |
강원도 | 37 | |
충청남도 | 33 | 6.6% |
부산광역시 | 31 | 6.2% |
전라북도 | 28 | 5.6% |
충청북도 | 27 | 5.4% |
Other values (7) | 85 |
Length
Value | Count | Frequency (%) |
경기도 | 85 | |
경상북도 | 49 | |
전라남도 | 45 | |
경상남도 | 41 | |
서울특별시 | 40 | |
강원도 | 37 | |
충청남도 | 33 | 6.6% |
부산광역시 | 31 | 6.2% |
전라북도 | 28 | 5.6% |
충청북도 | 27 | 5.4% |
Other values (7) | 85 |
기관명
Text
Distinct | 275 |
---|---|
Distinct (%) | 54.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
Length
Max length | 14 |
---|---|
Median length | 9 |
Mean length | 9.5748503 |
Min length | 8 |
Characters and Unicode
Total characters | 4797 |
---|---|
Distinct characters | 153 |
Distinct categories | 2 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 49 ? |
---|---|
Unique (%) | 9.8% |
Sample
1st row | 서울 강남구보건소 |
---|---|
2nd row | 서울 강남구보건소 |
3rd row | 서울 강동구보건소 |
4th row | 서울 강북구보건소 |
5th row | 서울 강북구보건소 |
Value | Count | Frequency (%) |
경기 | 83 | 7.8% |
경북 | 48 | 4.5% |
전남 | 44 | 4.1% |
경남 | 40 | 3.8% |
서울 | 39 | 3.7% |
강원 | 36 | 3.4% |
충남 | 32 | 3.0% |
부산 | 30 | 2.8% |
전북 | 27 | 2.5% |
충북 | 26 | 2.4% |
Other values (273) | 661 |
Most occurring characters
Value | Count | Frequency (%) |
565 | 11.8% | |
보 | 489 | 10.2% |
건 | 484 | 10.1% |
소 | 455 | 9.5% |
시 | 198 | 4.1% |
구 | 190 | 4.0% |
경 | 181 | 3.8% |
군 | 166 | 3.5% |
남 | 152 | 3.2% |
북 | 120 | 2.5% |
Other values (143) | 1797 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4232 | |
Space Separator | 565 | 11.8% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
보 | 489 | 11.6% |
건 | 484 | 11.4% |
소 | 455 | 10.8% |
시 | 198 | 4.7% |
구 | 190 | 4.5% |
경 | 181 | 4.3% |
군 | 166 | 3.9% |
남 | 152 | 3.6% |
북 | 120 | 2.8% |
원 | 113 | 2.7% |
Other values (142) | 1684 |
Space Separator
Value | Count | Frequency (%) |
565 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4232 | |
Common | 565 | 11.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
보 | 489 | 11.6% |
건 | 484 | 11.4% |
소 | 455 | 10.8% |
시 | 198 | 4.7% |
구 | 190 | 4.5% |
경 | 181 | 4.3% |
군 | 166 | 3.9% |
남 | 152 | 3.6% |
북 | 120 | 2.8% |
원 | 113 | 2.7% |
Other values (142) | 1684 |
Common
Value | Count | Frequency (%) |
565 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4232 | |
ASCII | 565 | 11.8% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
565 |
Hangul
Value | Count | Frequency (%) |
보 | 489 | 11.6% |
건 | 484 | 11.4% |
소 | 455 | 10.8% |
시 | 198 | 4.7% |
구 | 190 | 4.5% |
경 | 181 | 4.3% |
군 | 166 | 3.9% |
남 | 152 | 3.6% |
북 | 120 | 2.8% |
원 | 113 | 2.7% |
Other values (142) | 1684 |
인력구분
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
상담사 | |
---|---|
단속원 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 상담사 |
---|---|
2nd row | 단속원 |
3rd row | 상담사 |
4th row | 상담사 |
5th row | 단속원 |
Common Values
Value | Count | Frequency (%) |
상담사 | 272 | |
단속원 | 229 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
상담사 | 272 | |
단속원 | 229 |
최종학력(고등학교 이하)
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 15 |
---|---|
Distinct (%) | 3.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.2355289 |
Minimum | 0 |
---|---|
Maximum | 19 |
Zeros | 327 |
Zeros (%) | 65.3% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 2 |
95-th percentile | 6 |
Maximum | 19 |
Range | 19 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 2.3614435 |
---|---|
Coefficient of variation (CV) | 1.9112814 |
Kurtosis | 11.279256 |
Mean | 1.2355289 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 2.8694115 |
Sum | 619 |
Variance | 5.5764152 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 327 | |
2 | 48 | 9.6% |
1 | 35 | 7.0% |
3 | 25 | 5.0% |
4 | 20 | 4.0% |
5 | 14 | 2.8% |
6 | 11 | 2.2% |
8 | 8 | 1.6% |
7 | 5 | 1.0% |
9 | 2 | 0.4% |
Other values (5) | 6 | 1.2% |
Value | Count | Frequency (%) |
0 | 327 | |
1 | 35 | 7.0% |
2 | 48 | 9.6% |
3 | 25 | 5.0% |
4 | 20 | 4.0% |
5 | 14 | 2.8% |
6 | 11 | 2.2% |
7 | 5 | 1.0% |
8 | 8 | 1.6% |
9 | 2 | 0.4% |
Value | Count | Frequency (%) |
19 | 1 | 0.2% |
14 | 1 | 0.2% |
13 | 2 | 0.4% |
11 | 1 | 0.2% |
10 | 1 | 0.2% |
9 | 2 | 0.4% |
8 | 8 | |
7 | 5 | 1.0% |
6 | 11 | |
5 | 14 |
최종학력(전문대)
Real number (ℝ)
ZEROS
 
Distinct | 11 |
---|---|
Distinct (%) | 2.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.0499002 |
Minimum | 0 |
---|---|
Maximum | 15 |
Zeros | 237 |
Zeros (%) | 47.3% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 1 |
Q3 | 2 |
95-th percentile | 4 |
Maximum | 15 |
Range | 15 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 1.5084777 |
---|---|
Coefficient of variation (CV) | 1.436782 |
Kurtosis | 18.207373 |
Mean | 1.0499002 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 3.1230514 |
Sum | 526 |
Variance | 2.275505 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 237 | |
1 | 130 | |
2 | 72 | 14.4% |
3 | 36 | 7.2% |
4 | 11 | 2.2% |
5 | 8 | 1.6% |
9 | 2 | 0.4% |
6 | 2 | 0.4% |
15 | 1 | 0.2% |
7 | 1 | 0.2% |
Value | Count | Frequency (%) |
0 | 237 | |
1 | 130 | |
2 | 72 | 14.4% |
3 | 36 | 7.2% |
4 | 11 | 2.2% |
5 | 8 | 1.6% |
6 | 2 | 0.4% |
7 | 1 | 0.2% |
8 | 1 | 0.2% |
9 | 2 | 0.4% |
Value | Count | Frequency (%) |
15 | 1 | 0.2% |
9 | 2 | 0.4% |
8 | 1 | 0.2% |
7 | 1 | 0.2% |
6 | 2 | 0.4% |
5 | 8 | 1.6% |
4 | 11 | 2.2% |
3 | 36 | 7.2% |
2 | 72 | |
1 | 130 |
최종학력(대학교)
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 19 |
---|---|
Distinct (%) | 3.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2.5908184 |
Minimum | 0 |
---|---|
Maximum | 29 |
Zeros | 104 |
Zeros (%) | 20.8% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 1 |
median | 2 |
Q3 | 3 |
95-th percentile | 9 |
Maximum | 29 |
Range | 29 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 3.1588345 |
---|---|
Coefficient of variation (CV) | 1.219242 |
Kurtosis | 13.797926 |
Mean | 2.5908184 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 2.9383978 |
Sum | 1298 |
Variance | 9.9782355 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 125 | |
0 | 104 | |
2 | 98 | |
3 | 60 | |
4 | 36 | 7.2% |
5 | 18 | 3.6% |
6 | 18 | 3.6% |
8 | 10 | 2.0% |
9 | 6 | 1.2% |
10 | 5 | 1.0% |
Other values (9) | 21 | 4.2% |
Value | Count | Frequency (%) |
0 | 104 | |
1 | 125 | |
2 | 98 | |
3 | 60 | |
4 | 36 | 7.2% |
5 | 18 | 3.6% |
6 | 18 | 3.6% |
7 | 4 | 0.8% |
8 | 10 | 2.0% |
9 | 6 | 1.2% |
Value | Count | Frequency (%) |
29 | 1 | 0.2% |
20 | 1 | 0.2% |
16 | 2 | 0.4% |
15 | 2 | 0.4% |
14 | 1 | 0.2% |
13 | 3 | |
12 | 2 | 0.4% |
11 | 5 | |
10 | 5 | |
9 | 6 |
최종학력(대학원)
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 13 |
---|---|
Distinct (%) | 2.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 0.41117764 |
Minimum | 0 |
---|---|
Maximum | 17 |
Zeros | 428 |
Zeros (%) | 85.4% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 0 |
95-th percentile | 1 |
Maximum | 17 |
Range | 17 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 1.7130659 |
---|---|
Coefficient of variation (CV) | 4.1662428 |
Kurtosis | 41.23982 |
Mean | 0.41117764 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 6.1014382 |
Sum | 206 |
Variance | 2.9345948 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 428 | |
1 | 53 | 10.6% |
2 | 3 | 0.6% |
6 | 3 | 0.6% |
5 | 2 | 0.4% |
9 | 2 | 0.4% |
10 | 2 | 0.4% |
11 | 2 | 0.4% |
4 | 2 | 0.4% |
14 | 1 | 0.2% |
Other values (3) | 3 | 0.6% |
Value | Count | Frequency (%) |
0 | 428 | |
1 | 53 | 10.6% |
2 | 3 | 0.6% |
4 | 2 | 0.4% |
5 | 2 | 0.4% |
6 | 3 | 0.6% |
8 | 1 | 0.2% |
9 | 2 | 0.4% |
10 | 2 | 0.4% |
11 | 2 | 0.4% |
Value | Count | Frequency (%) |
17 | 1 | 0.2% |
14 | 1 | 0.2% |
12 | 1 | 0.2% |
11 | 2 | |
10 | 2 | |
9 | 2 | |
8 | 1 | 0.2% |
6 | 3 | |
5 | 2 | |
4 | 2 |
기관유형 | 지역 | 인력구분 | 최종학력(고등학교 이하) | 최종학력(전문대) | 최종학력(대학교) | 최종학력(대학원) | |
---|---|---|---|---|---|---|---|
기관유형 | 1.000 | 0.000 | 0.241 | 0.000 | 0.412 | 0.950 | 0.996 |
지역 | 0.000 | 1.000 | 0.000 | 0.260 | 0.238 | 0.206 | 0.314 |
인력구분 | 0.241 | 0.000 | 1.000 | 0.635 | 0.389 | 0.202 | 0.106 |
최종학력(고등학교 이하) | 0.000 | 0.260 | 0.635 | 1.000 | 0.000 | 0.000 | 0.000 |
최종학력(전문대) | 0.412 | 0.238 | 0.389 | 0.000 | 1.000 | 0.566 | 0.715 |
최종학력(대학교) | 0.950 | 0.206 | 0.202 | 0.000 | 0.566 | 1.000 | 0.865 |
최종학력(대학원) | 0.996 | 0.314 | 0.106 | 0.000 | 0.715 | 0.865 | 1.000 |
지역 | 기관유형 | 인력구분 | |
---|---|---|---|
지역 | 1.000 | 0.000 | 0.000 |
기관유형 | 0.000 | 1.000 | 0.155 |
인력구분 | 0.000 | 0.155 | 1.000 |
최종학력(고등학교 이하) | 최종학력(전문대) | 최종학력(대학교) | 최종학력(대학원) | 기관유형 | 지역 | 인력구분 | |
---|---|---|---|---|---|---|---|
최종학력(고등학교 이하) | 1.000 | -0.305 | -0.209 | -0.076 | 0.000 | 0.105 | 0.637 |
최종학력(전문대) | -0.305 | 1.000 | -0.073 | 0.072 | 0.236 | 0.065 | 0.290 |
최종학력(대학교) | -0.209 | -0.073 | 1.000 | 0.221 | 0.800 | 0.087 | 0.150 |
최종학력(대학원) | -0.076 | 0.072 | 0.221 | 1.000 | 0.937 | 0.126 | 0.080 |
기관유형 | 0.000 | 0.236 | 0.800 | 0.937 | 1.000 | 0.000 | 0.155 |
지역 | 0.105 | 0.065 | 0.087 | 0.126 | 0.000 | 1.000 | 0.000 |
인력구분 | 0.637 | 0.290 | 0.150 | 0.080 | 0.155 | 0.000 | 1.000 |
기관유형 | 지역 | 기관명 | 인력구분 | 최종학력(고등학교 이하) | 최종학력(전문대) | 최종학력(대학교) | 최종학력(대학원) | |
---|---|---|---|---|---|---|---|---|
0 | 보건소 | 서울특별시 | 서울 강남구보건소 | 상담사 | 0 | 0 | 4 | 0 |
1 | 보건소 | 서울특별시 | 서울 강남구보건소 | 단속원 | 0 | 0 | 9 | 0 |
2 | 보건소 | 서울특별시 | 서울 강동구보건소 | 상담사 | 0 | 0 | 2 | 1 |
3 | 보건소 | 서울특별시 | 서울 강북구보건소 | 상담사 | 1 | 2 | 5 | 1 |
4 | 보건소 | 서울특별시 | 서울 강북구보건소 | 단속원 | 3 | 0 | 0 | 0 |
5 | 보건소 | 서울특별시 | 서울 강서구보건소 | 단속원 | 3 | 0 | 8 | 0 |
6 | 보건소 | 서울특별시 | 서울 관악구보건소 | 상담사 | 0 | 0 | 3 | 0 |
7 | 보건소 | 서울특별시 | 서울 관악구보건소 | 단속원 | 2 | 0 | 0 | 0 |
8 | 보건소 | 서울특별시 | 서울 광진구보건소 | 상담사 | 0 | 1 | 2 | 0 |
9 | 보건소 | 서울특별시 | 서울 광진구보건소 | 단속원 | 0 | 1 | 1 | 1 |
기관유형 | 지역 | 기관명 | 인력구분 | 최종학력(고등학교 이하) | 최종학력(전문대) | 최종학력(대학교) | 최종학력(대학원) | |
---|---|---|---|---|---|---|---|---|
491 | 금연지원센터 | 경기도 | 경기남부금연지원센터 | 상담사 | 0 | 3 | 14 | 8 |
492 | 금연지원센터 | 경기도 | 경기북부금연지원센터 | 상담사 | 2 | 6 | 20 | 17 |
493 | 금연지원센터 | 강원도 | 강원금연지원센터 | 상담사 | 0 | 1 | 15 | 0 |
494 | 금연지원센터 | 충청북도 | 충북금연지원센터 | 상담사 | 0 | 3 | 11 | 5 |
495 | 금연지원센터 | 충청남도 | 충남금연지원센터 | 상담사 | 0 | 3 | 16 | 11 |
496 | 금연지원센터 | 전라북도 | 전북금연지원센터 | 상담사 | 0 | 2 | 11 | 6 |
497 | 금연지원센터 | 전라남도 | 전남금연지원센터 | 상담사 | 0 | 2 | 15 | 6 |
498 | 금연지원센터 | 경상북도 | 경북금연지원센터 | 상담사 | 1 | 4 | 13 | 4 |
499 | 금연지원센터 | 경상남도 | 경남금연지원센터 | 상담사 | 1 | 5 | 13 | 4 |
500 | 금연지원센터 | 제주특별자치도 | 제주금연지원센터 | 상담사 | 2 | 0 | 16 | 6 |