Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 2344 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 151.2 KiB |
Average record size in memory | 66.1 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 4 |
Text | 2 |
Boolean | 1 |
Dataset
Description | 고등학교 3학년 학생 중 중소·중견기업에 취업한 학생을 위한 장려금: 고교 취업연계 장려금 참여 고등학교 유형(특성화고, 일반고 등) 및 학교명에 따른 구분 |
---|---|
URL | https://www.data.go.kr/data/15101534/fileData.do |
상품명 has constant value "" | Constant |
장학년도 has constant value "" | Constant |
학교세부유형 is highly overall correlated with 고등학교유형 | High correlation |
고등학교유형 is highly overall correlated with 학교세부유형 and 1 other fields | High correlation |
참여여부 is highly overall correlated with 고등학교유형 | High correlation |
학교세부유형 is highly imbalanced (61.2%) | Imbalance |
고등학교유형 is highly imbalanced (56.8%) | Imbalance |
참여여부 is highly imbalanced (99.0%) | Imbalance |
순번 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 22:16:06.524398 |
---|---|
Analysis finished | 2023-12-12 22:16:07.631855 |
Duration | 1.11 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순번
Real number (ℝ)
UNIQUE
 
Distinct | 2344 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1172.5 |
Minimum | 1 |
---|---|
Maximum | 2344 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 20.7 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 118.15 |
Q1 | 586.75 |
median | 1172.5 |
Q3 | 1758.25 |
95-th percentile | 2226.85 |
Maximum | 2344 |
Range | 2343 |
Interquartile range (IQR) | 1171.5 |
Descriptive statistics
Standard deviation | 676.79884 |
---|---|
Coefficient of variation (CV) | 0.57722715 |
Kurtosis | -1.2 |
Mean | 1172.5 |
Median Absolute Deviation (MAD) | 586 |
Skewness | 0 |
Sum | 2748340 |
Variance | 458056.67 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
1576 | 1 | < 0.1% |
1560 | 1 | < 0.1% |
1561 | 1 | < 0.1% |
1562 | 1 | < 0.1% |
1563 | 1 | < 0.1% |
1564 | 1 | < 0.1% |
1565 | 1 | < 0.1% |
1566 | 1 | < 0.1% |
1567 | 1 | < 0.1% |
Other values (2334) | 2334 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
2344 | 1 | |
2343 | 1 | |
2342 | 1 | |
2341 | 1 | |
2340 | 1 | |
2339 | 1 | |
2338 | 1 | |
2337 | 1 | |
2336 | 1 | |
2335 | 1 |
상품명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 18.4 KiB |
고교 취업연계 장려금 |
---|
Length
Max length | 11 |
---|---|
Median length | 11 |
Mean length | 11 |
Min length | 11 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 고교 취업연계 장려금 |
---|---|
2nd row | 고교 취업연계 장려금 |
3rd row | 고교 취업연계 장려금 |
4th row | 고교 취업연계 장려금 |
5th row | 고교 취업연계 장려금 |
Common Values
Value | Count | Frequency (%) |
고교 취업연계 장려금 | 2344 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
고교 | 2344 | |
취업연계 | 2344 | |
장려금 | 2344 |
장학년도
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 18.4 KiB |
2022 |
---|
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2022 |
---|---|
2nd row | 2022 |
3rd row | 2022 |
4th row | 2022 |
5th row | 2022 |
Common Values
Value | Count | Frequency (%) |
2022 | 2344 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2022 | 2344 |
고등학교명
Text
Distinct | 2232 |
---|---|
Distinct (%) | 95.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 18.4 KiB |
Value | Count | Frequency (%) |
금천고등학교 | 3 | 0.1% |
금성고등학교 | 3 | 0.1% |
영산고등학교 | 3 | 0.1% |
덕산고등학교 | 3 | 0.1% |
경일고등학교 | 3 | 0.1% |
강동고등학교 | 3 | 0.1% |
광남고등학교 | 3 | 0.1% |
대진고등학교 | 3 | 0.1% |
영동고등학교 | 3 | 0.1% |
세화고등학교 | 3 | 0.1% |
Other values (2224) | 2316 |
Most occurring characters
Value | Count | Frequency (%) |
학 | 2512 | 14.3% |
교 | 2388 | 13.6% |
고 | 2371 | 13.5% |
등 | 2346 | 13.4% |
자 | 423 | 2.4% |
여 | 392 | 2.2% |
산 | 232 | 1.3% |
대 | 217 | 1.2% |
천 | 176 | 1.0% |
성 | 168 | 1.0% |
Other values (372) | 6285 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 17483 | |
Lowercase Letter | 14 | 0.1% |
Uppercase Letter | 10 | 0.1% |
Space Separator | 2 | < 0.1% |
Dash Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
학 | 2512 | |
교 | 2388 | 13.7% |
고 | 2371 | 13.6% |
등 | 2346 | 13.4% |
자 | 423 | 2.4% |
여 | 392 | 2.2% |
산 | 232 | 1.3% |
대 | 217 | 1.2% |
천 | 176 | 1.0% |
성 | 168 | 1.0% |
Other values (355) | 6258 |
Lowercase Letter
Value | Count | Frequency (%) |
s | 4 | |
n | 2 | |
e | 2 | |
i | 2 | |
l | 1 | 7.1% |
h | 1 | 7.1% |
g | 1 | 7.1% |
u | 1 | 7.1% |
Uppercase Letter
Value | Count | Frequency (%) |
P | 2 | |
I | 2 | |
T | 2 | |
B | 1 | |
K | 1 | |
O | 1 | |
E | 1 |
Space Separator
Value | Count | Frequency (%) |
2 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 17483 | |
Latin | 24 | 0.1% |
Common | 3 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
학 | 2512 | |
교 | 2388 | 13.7% |
고 | 2371 | 13.6% |
등 | 2346 | 13.4% |
자 | 423 | 2.4% |
여 | 392 | 2.2% |
산 | 232 | 1.3% |
대 | 217 | 1.2% |
천 | 176 | 1.0% |
성 | 168 | 1.0% |
Other values (355) | 6258 |
Latin
Value | Count | Frequency (%) |
s | 4 | |
P | 2 | 8.3% |
I | 2 | 8.3% |
T | 2 | 8.3% |
n | 2 | 8.3% |
e | 2 | 8.3% |
i | 2 | 8.3% |
B | 1 | 4.2% |
l | 1 | 4.2% |
h | 1 | 4.2% |
Other values (5) | 5 |
Common
Value | Count | Frequency (%) |
2 | ||
- | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 17483 | |
ASCII | 27 | 0.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
학 | 2512 | |
교 | 2388 | 13.7% |
고 | 2371 | 13.6% |
등 | 2346 | 13.4% |
자 | 423 | 2.4% |
여 | 392 | 2.2% |
산 | 232 | 1.3% |
대 | 217 | 1.2% |
천 | 176 | 1.0% |
성 | 168 | 1.0% |
Other values (355) | 6258 |
ASCII
Value | Count | Frequency (%) |
s | 4 | |
P | 2 | 7.4% |
I | 2 | 7.4% |
T | 2 | 7.4% |
n | 2 | 7.4% |
e | 2 | 7.4% |
2 | 7.4% | |
i | 2 | 7.4% |
B | 1 | 3.7% |
l | 1 | 3.7% |
Other values (7) | 7 |
학교세부유형
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 7 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 18.4 KiB |
일반고 | |
---|---|
특성화고 및 예체능고 | |
외국어고 | 28 |
과학고 | 19 |
영재고 | 8 |
Other values (2) | 11 |
Length
Max length | 11 |
---|---|
Median length | 3 |
Mean length | 5.2986348 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 일반고 |
---|---|
2nd row | 일반고 |
3rd row | 일반고 |
4th row | 일반고 |
5th row | 특성화고 및 예체능고 |
Common Values
Value | Count | Frequency (%) |
일반고 | 1608 | |
특성화고 및 예체능고 | 670 | |
외국어고 | 28 | 1.2% |
과학고 | 19 | 0.8% |
영재고 | 8 | 0.3% |
국제고 | 8 | 0.3% |
자율고 | 3 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
일반고 | 1608 | |
특성화고 | 670 | |
및 | 670 | |
예체능고 | 670 | |
외국어고 | 28 | 0.8% |
과학고 | 19 | 0.5% |
영재고 | 8 | 0.2% |
국제고 | 8 | 0.2% |
자율고 | 3 | 0.1% |
고등학교유형
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 15 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 18.4 KiB |
일반고 | |
---|---|
공업고 | |
상업고 | |
종합고 | 47 |
농림업고 | 45 |
Other values (10) |
Length
Max length | 7 |
---|---|
Median length | 3 |
Mean length | 3.0341297 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 일반고 |
---|---|
2nd row | 일반고 |
3rd row | 일반고 |
4th row | 일반고 |
5th row | 종합고 |
Common Values
Value | Count | Frequency (%) |
일반고 | 1667 | |
공업고 | 229 | 9.8% |
상업고 | 178 | 7.6% |
종합고 | 47 | 2.0% |
농림업고 | 45 | 1.9% |
가사고 | 31 | 1.3% |
외국어고 | 31 | 1.3% |
예술고 | 29 | 1.2% |
과학고 | 27 | 1.2% |
실업고 | 23 | 1.0% |
Other values (5) | 37 | 1.6% |
Length
Value | Count | Frequency (%) |
일반고 | 1667 | |
공업고 | 229 | 9.8% |
상업고 | 178 | 7.6% |
종합고 | 47 | 2.0% |
농림업고 | 45 | 1.9% |
가사고 | 31 | 1.3% |
외국어고 | 31 | 1.3% |
예술고 | 29 | 1.2% |
과학고 | 27 | 1.2% |
실업고 | 23 | 1.0% |
Other values (5) | 37 | 1.6% |
학교주소
Text
Distinct | 2328 |
---|---|
Distinct (%) | 99.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 18.4 KiB |
Length
Max length | 46 |
---|---|
Median length | 38 |
Mean length | 23.087031 |
Min length | 10 |
Characters and Unicode
Total characters | 54116 |
---|---|
Distinct characters | 444 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 2314 ? |
---|---|
Unique (%) | 98.7% |
Sample
1st row | 강원도 삼척시 가곡면 가곡천로 1427 . 가곡고등학교 |
---|---|
2nd row | 서울특별시 송파구 송이로 42 |
3rd row | 인천광역시 서구 원적로 58 |
4th row | 부산광역시 부산진구 엄광로 152 |
5th row | 경기도 안성시 샛터길 46 . 가온고등학교 |
Value | Count | Frequency (%) |
642 | 5.5% | |
경기도 | 476 | 4.1% |
서울특별시 | 319 | 2.7% |
경상남도 | 187 | 1.6% |
경상북도 | 181 | 1.5% |
부산광역시 | 141 | 1.2% |
전라남도 | 140 | 1.2% |
전라북도 | 128 | 1.1% |
인천광역시 | 124 | 1.1% |
충청남도 | 115 | 1.0% |
Other values (4180) | 9248 |
Most occurring characters
Value | Count | Frequency (%) |
11663 | 21.6% | |
시 | 2052 | 3.8% |
로 | 1987 | 3.7% |
도 | 1573 | 2.9% |
1 | 1571 | 2.9% |
구 | 1393 | 2.6% |
2 | 1068 | 2.0% |
길 | 999 | 1.8% |
경 | 973 | 1.8% |
3 | 892 | 1.6% |
Other values (434) | 29945 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 33829 | |
Space Separator | 11663 | 21.6% |
Decimal Number | 7664 | 14.2% |
Other Punctuation | 664 | 1.2% |
Dash Punctuation | 295 | 0.5% |
Close Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 2052 | 6.1% |
로 | 1987 | 5.9% |
도 | 1573 | 4.6% |
구 | 1393 | 4.1% |
길 | 999 | 3.0% |
경 | 973 | 2.9% |
고 | 831 | 2.5% |
남 | 789 | 2.3% |
학 | 778 | 2.3% |
교 | 736 | 2.2% |
Other values (420) | 21718 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1571 | |
2 | 1068 | |
3 | 892 | |
5 | 719 | |
4 | 706 | |
6 | 626 | 8.2% |
7 | 613 | 8.0% |
0 | 562 | 7.3% |
9 | 475 | 6.2% |
8 | 432 | 5.6% |
Space Separator
Value | Count | Frequency (%) |
11663 |
Other Punctuation
Value | Count | Frequency (%) |
. | 664 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 295 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 33829 | |
Common | 20287 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 2052 | 6.1% |
로 | 1987 | 5.9% |
도 | 1573 | 4.6% |
구 | 1393 | 4.1% |
길 | 999 | 3.0% |
경 | 973 | 2.9% |
고 | 831 | 2.5% |
남 | 789 | 2.3% |
학 | 778 | 2.3% |
교 | 736 | 2.2% |
Other values (420) | 21718 |
Common
Value | Count | Frequency (%) |
11663 | ||
1 | 1571 | 7.7% |
2 | 1068 | 5.3% |
3 | 892 | 4.4% |
5 | 719 | 3.5% |
4 | 706 | 3.5% |
. | 664 | 3.3% |
6 | 626 | 3.1% |
7 | 613 | 3.0% |
0 | 562 | 2.8% |
Other values (4) | 1203 | 5.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 33829 | |
ASCII | 20287 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
11663 | ||
1 | 1571 | 7.7% |
2 | 1068 | 5.3% |
3 | 892 | 4.4% |
5 | 719 | 3.5% |
4 | 706 | 3.5% |
. | 664 | 3.3% |
6 | 626 | 3.1% |
7 | 613 | 3.0% |
0 | 562 | 2.8% |
Other values (4) | 1203 | 5.9% |
Hangul
Value | Count | Frequency (%) |
시 | 2052 | 6.1% |
로 | 1987 | 5.9% |
도 | 1573 | 4.6% |
구 | 1393 | 4.1% |
길 | 999 | 3.0% |
경 | 973 | 2.9% |
고 | 831 | 2.5% |
남 | 789 | 2.3% |
학 | 778 | 2.3% |
교 | 736 | 2.2% |
Other values (420) | 21718 |
참여여부
Boolean
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.4 KiB |
True | |
---|---|
False | 2 |
Value | Count | Frequency (%) |
True | 2342 | |
False | 2 | 0.1% |
순번 | 학교세부유형 | 고등학교유형 | 참여여부 | |
---|---|---|---|---|
순번 | 1.000 | 0.067 | 0.105 | 0.000 |
학교세부유형 | 0.067 | 1.000 | 0.929 | 0.000 |
고등학교유형 | 0.105 | 0.929 | 1.000 | 0.752 |
참여여부 | 0.000 | 0.000 | 0.752 | 1.000 |
고등학교유형 | 학교세부유형 | 참여여부 | |
---|---|---|---|
고등학교유형 | 1.000 | 0.763 | 0.703 |
학교세부유형 | 0.763 | 1.000 | 0.000 |
참여여부 | 0.703 | 0.000 | 1.000 |
순번 | 학교세부유형 | 고등학교유형 | 참여여부 | |
---|---|---|---|---|
순번 | 1.000 | 0.034 | 0.039 | 0.000 |
학교세부유형 | 0.034 | 1.000 | 0.763 | 0.000 |
고등학교유형 | 0.039 | 0.763 | 1.000 | 0.703 |
참여여부 | 0.000 | 0.000 | 0.703 | 1.000 |
순번 | 상품명 | 장학년도 | 고등학교명 | 학교세부유형 | 고등학교유형 | 학교주소 | 참여여부 | |
---|---|---|---|---|---|---|---|---|
0 | 1 | 고교 취업연계 장려금 | 2022 | 가곡고등학교 | 일반고 | 일반고 | 강원도 삼척시 가곡면 가곡천로 1427 . 가곡고등학교 | Y |
1 | 2 | 고교 취업연계 장려금 | 2022 | 가락고등학교 | 일반고 | 일반고 | 서울특별시 송파구 송이로 42 | Y |
2 | 3 | 고교 취업연계 장려금 | 2022 | 가림고등학교 | 일반고 | 일반고 | 인천광역시 서구 원적로 58 | Y |
3 | 4 | 고교 취업연계 장려금 | 2022 | 가야고등학교 | 일반고 | 일반고 | 부산광역시 부산진구 엄광로 152 | Y |
4 | 5 | 고교 취업연계 장려금 | 2022 | 가온고등학교 | 특성화고 및 예체능고 | 종합고 | 경기도 안성시 샛터길 46 . 가온고등학교 | Y |
5 | 6 | 고교 취업연계 장려금 | 2022 | 가운고등학교 | 일반고 | 일반고 | 경기도 남양주시 가운로2길 115 | Y |
6 | 7 | 고교 취업연계 장려금 | 2022 | 가은고등학교 | 일반고 | 일반고 | 경상북도 문경시 가은읍 가은로 205 . 가은고등학교 | Y |
7 | 8 | 고교 취업연계 장려금 | 2022 | 가재울고등학교 | 일반고 | 일반고 | 서울특별시 서대문구 수색로 100-35 | Y |
8 | 9 | 고교 취업연계 장려금 | 2022 | 가정고등학교 | 일반고 | 일반고 | 인천광역시 서구 서달로 162 | Y |
9 | 10 | 고교 취업연계 장려금 | 2022 | 가좌고등학교 | 일반고 | 일반고 | 인천광역시 서구 장고개로287번길 24 | Y |
순번 | 상품명 | 장학년도 | 고등학교명 | 학교세부유형 | 고등학교유형 | 학교주소 | 참여여부 | |
---|---|---|---|---|---|---|---|---|
2334 | 2335 | 고교 취업연계 장려금 | 2022 | 효정고등학교 | 일반고 | 일반고 | 울산광역시 북구 율동2길 41 | Y |
2335 | 2336 | 고교 취업연계 장려금 | 2022 | 효청보건고등학교 | 특성화고 및 예체능고 | 가사고 | 경상북도 경주시 외동읍 모화남1길 26-132 | Y |
2336 | 2337 | 고교 취업연계 장려금 | 2022 | 후포고등학교 | 일반고 | 일반고 | 경상북도 울진군 후포면 후포로 41 | Y |
2337 | 2338 | 고교 취업연계 장려금 | 2022 | 휘경공업고등학교 | 특성화고 및 예체능고 | 공업고 | 서울특별시 동대문구 겸재로 21 . 휘경공업고등학교 | Y |
2338 | 2339 | 고교 취업연계 장려금 | 2022 | 휘경여자고등학교 | 일반고 | 일반고 | 서울특별시 동대문구 한천로 247 | Y |
2339 | 2340 | 고교 취업연계 장려금 | 2022 | 휘문고등학교 | 일반고 | 일반고 | 서울특별시 강남구 역삼로 541 | Y |
2340 | 2341 | 고교 취업연계 장려금 | 2022 | 휘봉고등학교 | 일반고 | 일반고 | 서울특별시 동대문구 한천로 290 | Y |
2341 | 2342 | 고교 취업연계 장려금 | 2022 | 흥덕고등학교 | 일반고 | 일반고 | 충청북도 청주시 흥덕구 증안로 9 | Y |
2342 | 2343 | 고교 취업연계 장려금 | 2022 | 흥덕고등학교 | 일반고 | 일반고 | 경기도 용인시 기흥구 흥덕2로 36 | Y |
2343 | 2344 | 고교 취업연계 장려금 | 2022 | 흥진고등학교 | 일반고 | 일반고 | 경기도 군포시 오금로 15-17 | Y |