Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 5517 |
Missing cells | 835 |
Missing cells (%) | 2.5% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 264.1 KiB |
Average record size in memory | 49.0 B |
Variable types
Categorical | 3 |
---|---|
Text | 2 |
Numeric | 1 |
Dataset
Description | 특정 통계표와 관련이 있는 통계표 정보(관련 통계표 정보)를 표시. 특정 통계표가 특정 기간 동안 공표가된 이후 분류체계 개편 등으로 더 이상 서비스가 되지 않고 새로운 분류체계를 적용한 통계표로 서비스를 시작할 경우, 새로운 통계표의 관련 통계표로 이전 통계표를 관리하고 있음 |
---|---|
Author | 통계청 |
URL | https://www.data.go.kr/data/15085083/fileData.do |
관련통계표_기관코드 is highly overall correlated with 기관명 and 1 other fields | High correlation |
관련통계표 설명 is highly overall correlated with 순번 and 2 other fields | High correlation |
기관명 is highly overall correlated with 관련통계표_기관코드 and 1 other fields | High correlation |
순번 is highly overall correlated with 관련통계표 설명 | High correlation |
기관명 is highly imbalanced (53.2%) | Imbalance |
관련통계표_기관코드 is highly imbalanced (53.8%) | Imbalance |
관련통계표 설명 is highly imbalanced (70.3%) | Imbalance |
순번 has 835 (15.1%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 06:29:12.251790 |
---|---|
Analysis finished | 2023-12-12 06:29:13.026323 |
Duration | 0.77 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
기관명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 33 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 43.2 KiB |
통계청 | |
---|---|
산업통상자원부 | 285 |
경찰청 | 278 |
중소벤처기업부 | 266 |
한국주택금융공사 | 164 |
Other values (28) |
Length
Max length | 10 |
---|---|
Median length | 3 |
Mean length | 4.1935835 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 한국교육개발원 |
---|---|
2nd row | 한국교육개발원 |
3rd row | 한국교육개발원 |
4th row | 한국교육개발원 |
5th row | 한국교육개발원 |
Common Values
Value | Count | Frequency (%) |
통계청 | 3545 | |
산업통상자원부 | 285 | 5.2% |
경찰청 | 278 | 5.0% |
중소벤처기업부 | 266 | 4.8% |
한국주택금융공사 | 164 | 3.0% |
건강보험심사평가원 | 134 | 2.4% |
한국여성경제인협회 | 120 | 2.2% |
보건복지부 | 112 | 2.0% |
교육부 | 98 | 1.8% |
산림청 | 84 | 1.5% |
Other values (23) | 431 | 7.8% |
Length
Value | Count | Frequency (%) |
통계청 | 3545 | |
산업통상자원부 | 285 | 5.2% |
경찰청 | 278 | 5.0% |
중소벤처기업부 | 266 | 4.8% |
한국주택금융공사 | 164 | 3.0% |
건강보험심사평가원 | 134 | 2.4% |
한국여성경제인협회 | 120 | 2.2% |
보건복지부 | 112 | 2.0% |
교육부 | 98 | 1.8% |
산림청 | 84 | 1.5% |
Other values (24) | 439 | 7.9% |
통계표번호
Text
Distinct | 3791 |
---|---|
Distinct (%) | 68.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 43.2 KiB |
Length
Max length | 27 |
---|---|
Median length | 24 |
Mean length | 11.621352 |
Min length | 8 |
Characters and Unicode
Total characters | 64115 |
---|---|
Distinct characters | 37 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 2714 ? |
---|---|
Unique (%) | 49.2% |
Sample
1st row | TX_334_2009_H1006 |
---|---|
2nd row | DT_33403N_002 |
3rd row | DT_33403N_001 |
4th row | DT_33403N_003 |
5th row | TX_334_2009_H1008 |
Value | Count | Frequency (%) |
dt_13622_2017001 | 45 | 0.8% |
dt_jun_01 | 18 | 0.3% |
dt_lee_02 | 17 | 0.3% |
dt_354005n_007 | 17 | 0.3% |
dt_lee_34 | 10 | 0.2% |
dt_1in9002 | 9 | 0.2% |
dt_1in7002 | 9 | 0.2% |
dt_1in7502 | 9 | 0.2% |
dt_1in8502 | 9 | 0.2% |
dt_1in9502 | 9 | 0.2% |
Other values (3781) | 5365 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 10296 | |
0 | 8280 | |
_ | 8175 | |
T | 4940 | 7.7% |
D | 4212 | 6.6% |
2 | 3734 | 5.8% |
3 | 3183 | 5.0% |
5 | 2387 | 3.7% |
N | 2037 | 3.2% |
4 | 1912 | 3.0% |
Other values (27) | 14959 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 34285 | |
Uppercase Letter | 21655 | |
Connector Punctuation | 8175 | 12.8% |
Most frequent character per category
Uppercase Letter
Value | Count | Frequency (%) |
T | 4940 | |
D | 4212 | |
N | 2037 | |
I | 1790 | 8.3% |
A | 1360 | 6.3% |
H | 1245 | 5.7% |
E | 972 | 4.5% |
X | 692 | 3.2% |
K | 624 | 2.9% |
B | 577 | 2.7% |
Other values (16) | 3206 |
Decimal Number
Value | Count | Frequency (%) |
1 | 10296 | |
0 | 8280 | |
2 | 3734 | 10.9% |
3 | 3183 | 9.3% |
5 | 2387 | 7.0% |
4 | 1912 | 5.6% |
6 | 1284 | 3.7% |
9 | 1206 | 3.5% |
7 | 1179 | 3.4% |
8 | 824 | 2.4% |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 8175 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 42460 | |
Latin | 21655 |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
T | 4940 | |
D | 4212 | |
N | 2037 | |
I | 1790 | 8.3% |
A | 1360 | 6.3% |
H | 1245 | 5.7% |
E | 972 | 4.5% |
X | 692 | 3.2% |
K | 624 | 2.9% |
B | 577 | 2.7% |
Other values (16) | 3206 |
Common
Value | Count | Frequency (%) |
1 | 10296 | |
0 | 8280 | |
_ | 8175 | |
2 | 3734 | 8.8% |
3 | 3183 | 7.5% |
5 | 2387 | 5.6% |
4 | 1912 | 4.5% |
6 | 1284 | 3.0% |
9 | 1206 | 2.8% |
7 | 1179 | 2.8% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 64115 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 10296 | |
0 | 8280 | |
_ | 8175 | |
T | 4940 | 7.7% |
D | 4212 | 6.6% |
2 | 3734 | 5.8% |
3 | 3183 | 5.0% |
5 | 2387 | 3.7% |
N | 2037 | 3.2% |
4 | 1912 | 3.0% |
Other values (27) | 14959 |
관련통계표_기관코드
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 35 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 43.2 KiB |
통계청 | |
---|---|
산업통상자원부 | 285 |
경찰청 | 278 |
중소벤처기업부 | 266 |
한국주택금융공사 | 164 |
Other values (30) |
Length
Max length | 10 |
---|---|
Median length | 3 |
Mean length | 4.1944898 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 한국교육개발원 |
---|---|
2nd row | 한국교육개발원 |
3rd row | 한국교육개발원 |
4th row | 한국교육개발원 |
5th row | 한국교육개발원 |
Common Values
Value | Count | Frequency (%) |
통계청 | 3545 | |
산업통상자원부 | 285 | 5.2% |
경찰청 | 278 | 5.0% |
중소벤처기업부 | 266 | 4.8% |
한국주택금융공사 | 164 | 3.0% |
건강보험심사평가원 | 134 | 2.4% |
한국여성경제인협회 | 120 | 2.2% |
보건복지부 | 109 | 2.0% |
교육부 | 98 | 1.8% |
산림청 | 84 | 1.5% |
Other values (25) | 434 | 7.9% |
Length
Value | Count | Frequency (%) |
통계청 | 3545 | |
산업통상자원부 | 285 | 5.2% |
경찰청 | 278 | 5.0% |
중소벤처기업부 | 266 | 4.8% |
한국주택금융공사 | 164 | 3.0% |
건강보험심사평가원 | 134 | 2.4% |
한국여성경제인협회 | 120 | 2.2% |
보건복지부 | 109 | 2.0% |
교육부 | 98 | 1.8% |
산림청 | 84 | 1.5% |
Other values (26) | 442 | 8.0% |
관련통계표번호
Text
Distinct | 3163 |
---|---|
Distinct (%) | 57.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 43.2 KiB |
Length
Max length | 24 |
---|---|
Median length | 22 |
Mean length | 11.015588 |
Min length | 7 |
Characters and Unicode
Total characters | 60773 |
---|---|
Distinct characters | 36 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 2063 ? |
---|---|
Unique (%) | 37.4% |
Sample
1st row | DT_33403N_001 |
---|---|
2nd row | TX_334_2009_H1008 |
3rd row | TX_334_2009_H1006 |
4th row | TX_334_2009_H1009 |
5th row | DT_33403N_002 |
Value | Count | Frequency (%) |
dt_13622_2017001 | 39 | 0.7% |
1b26003_a01 | 34 | 0.6% |
dt_1yl0000 | 29 | 0.5% |
dt_1k52b01 | 19 | 0.3% |
dt_1c81 | 18 | 0.3% |
dt_jun_01 | 18 | 0.3% |
dt_1b81a17 | 18 | 0.3% |
dt_1b83a15 | 17 | 0.3% |
dt_1j17005 | 17 | 0.3% |
dt_1j0a004 | 17 | 0.3% |
Other values (3153) | 5291 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 10139 | |
0 | 8204 | |
_ | 7350 | |
T | 5660 | |
D | 4933 | 8.1% |
2 | 3336 | 5.5% |
3 | 2751 | 4.5% |
5 | 2292 | 3.8% |
4 | 1823 | 3.0% |
A | 1318 | 2.2% |
Other values (26) | 12967 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 32801 | |
Uppercase Letter | 20622 | |
Connector Punctuation | 7350 | 12.1% |
Most frequent character per category
Uppercase Letter
Value | Count | Frequency (%) |
T | 5660 | |
D | 4933 | |
A | 1318 | 6.4% |
N | 1231 | 6.0% |
I | 1015 | 4.9% |
E | 973 | 4.7% |
X | 692 | 3.4% |
K | 624 | 3.0% |
B | 601 | 2.9% |
O | 518 | 2.5% |
Other values (15) | 3057 |
Decimal Number
Value | Count | Frequency (%) |
1 | 10139 | |
0 | 8204 | |
2 | 3336 | 10.2% |
3 | 2751 | 8.4% |
5 | 2292 | 7.0% |
4 | 1823 | 5.6% |
6 | 1172 | 3.6% |
7 | 1141 | 3.5% |
9 | 1129 | 3.4% |
8 | 814 | 2.5% |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 7350 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 40151 | |
Latin | 20622 |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
T | 5660 | |
D | 4933 | |
A | 1318 | 6.4% |
N | 1231 | 6.0% |
I | 1015 | 4.9% |
E | 973 | 4.7% |
X | 692 | 3.4% |
K | 624 | 3.0% |
B | 601 | 2.9% |
O | 518 | 2.5% |
Other values (15) | 3057 |
Common
Value | Count | Frequency (%) |
1 | 10139 | |
0 | 8204 | |
_ | 7350 | |
2 | 3336 | 8.3% |
3 | 2751 | 6.9% |
5 | 2292 | 5.7% |
4 | 1823 | 4.5% |
6 | 1172 | 2.9% |
7 | 1141 | 2.8% |
9 | 1129 | 2.8% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 60773 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 10139 | |
0 | 8204 | |
_ | 7350 | |
T | 5660 | |
D | 4933 | 8.1% |
2 | 3336 | 5.5% |
3 | 2751 | 4.5% |
5 | 2292 | 3.8% |
4 | 1823 | 3.0% |
A | 1318 | 2.2% |
Other values (26) | 12967 |
순번
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 19 |
---|---|
Distinct (%) | 0.4% |
Missing | 835 |
Missing (%) | 15.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 16.446604 |
Minimum | 1 |
---|---|
Maximum | 180 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 48.6 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 10 |
Q1 | 10 |
median | 10 |
Q3 | 20 |
95-th percentile | 40 |
Maximum | 180 |
Range | 179 |
Interquartile range (IQR) | 10 |
Descriptive statistics
Standard deviation | 14.92948 |
---|---|
Coefficient of variation (CV) | 0.90775457 |
Kurtosis | 26.907775 |
Mean | 16.446604 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 4.1919943 |
Sum | 77003 |
Variance | 222.88937 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
10 | 2869 | |
20 | 1042 | 18.9% |
30 | 264 | 4.8% |
1 | 183 | 3.3% |
40 | 108 | 2.0% |
50 | 71 | 1.3% |
60 | 54 | 1.0% |
70 | 33 | 0.6% |
80 | 23 | 0.4% |
90 | 14 | 0.3% |
Other values (9) | 21 | 0.4% |
(Missing) | 835 | 15.1% |
Value | Count | Frequency (%) |
1 | 183 | 3.3% |
10 | 2869 | |
20 | 1042 | 18.9% |
30 | 264 | 4.8% |
40 | 108 | 2.0% |
50 | 71 | 1.3% |
60 | 54 | 1.0% |
70 | 33 | 0.6% |
80 | 23 | 0.4% |
90 | 14 | 0.3% |
Value | Count | Frequency (%) |
180 | 2 | < 0.1% |
170 | 2 | < 0.1% |
160 | 2 | < 0.1% |
150 | 2 | < 0.1% |
140 | 2 | < 0.1% |
130 | 2 | < 0.1% |
120 | 3 | 0.1% |
110 | 3 | 0.1% |
100 | 3 | 0.1% |
90 | 14 |
관련통계표 설명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 43.2 KiB |
<NA> | |
---|---|
원통계표 | |
1998년자료 | 1 |
산업분류 8차 개정으로 1996~2006년 자료가 수록되어 있음 | 1 |
Length
Max length | 35 |
---|---|
Median length | 4 |
Mean length | 4.0061628 |
Min length | 4 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 4731 | |
원통계표 | 784 | 14.2% |
1998년자료 | 1 | < 0.1% |
산업분류 8차 개정으로 1996~2006년 자료가 수록되어 있음 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 4731 | |
원통계표 | 784 | 14.2% |
1998년자료 | 1 | < 0.1% |
산업분류 | 1 | < 0.1% |
8차 | 1 | < 0.1% |
개정으로 | 1 | < 0.1% |
1996~2006년 | 1 | < 0.1% |
자료가 | 1 | < 0.1% |
수록되어 | 1 | < 0.1% |
있음 | 1 | < 0.1% |
기관명 | 관련통계표_기관코드 | 순번 | 관련통계표 설명 | |
---|---|---|---|---|
기관명 | 1.000 | 0.999 | 0.575 | NaN |
관련통계표_기관코드 | 0.999 | 1.000 | 0.577 | NaN |
순번 | 0.575 | 0.577 | 1.000 | 1.000 |
관련통계표 설명 | NaN | NaN | 1.000 | 1.000 |
관련통계표_기관코드 | 관련통계표 설명 | 기관명 | |
---|---|---|---|
관련통계표_기관코드 | 1.000 | 1.000 | 0.984 |
관련통계표 설명 | 1.000 | 1.000 | 1.000 |
기관명 | 0.984 | 1.000 | 1.000 |
순번 | 기관명 | 관련통계표_기관코드 | 관련통계표 설명 | |
---|---|---|---|---|
순번 | 1.000 | 0.243 | 0.242 | 1.000 |
기관명 | 0.243 | 1.000 | 0.984 | 1.000 |
관련통계표_기관코드 | 0.242 | 0.984 | 1.000 | 1.000 |
관련통계표 설명 | 1.000 | 1.000 | 1.000 | 1.000 |
기관명 | 통계표번호 | 관련통계표_기관코드 | 관련통계표번호 | 순번 | 관련통계표 설명 | |
---|---|---|---|---|---|---|
0 | 한국교육개발원 | TX_334_2009_H1006 | 한국교육개발원 | DT_33403N_001 | 10 | <NA> |
1 | 한국교육개발원 | DT_33403N_002 | 한국교육개발원 | TX_334_2009_H1008 | 10 | <NA> |
2 | 한국교육개발원 | DT_33403N_001 | 한국교육개발원 | TX_334_2009_H1006 | 10 | <NA> |
3 | 한국교육개발원 | DT_33403N_003 | 한국교육개발원 | TX_334_2009_H1009 | 10 | <NA> |
4 | 한국교육개발원 | TX_334_2009_H1008 | 한국교육개발원 | DT_33403N_002 | 10 | <NA> |
5 | 한국교육개발원 | TX_334_2009_H1009 | 한국교육개발원 | DT_33403N_003 | 10 | <NA> |
6 | 중소기업중앙회 | DT_A10100 | 중소기업중앙회 | DT_B10100 | 10 | <NA> |
7 | 중소기업중앙회 | DT_A10108 | 중소기업중앙회 | DT_J10009 | 20 | <NA> |
8 | 중소기업중앙회 | DT_J10006 | 중소기업중앙회 | DT_A10105 | 10 | <NA> |
9 | 중소기업중앙회 | DT_J10003 | 중소기업중앙회 | DT_A10102 | 10 | <NA> |
기관명 | 통계표번호 | 관련통계표_기관코드 | 관련통계표번호 | 순번 | 관련통계표 설명 | |
---|---|---|---|---|---|---|
5507 | 국가평생교육진흥원 | DT_42001N_102 | 국가평생교육진흥원 | DT_42001N_020 | <NA> | <NA> |
5508 | 국가평생교육진흥원 | DT_42001N_102 | 국가평생교육진흥원 | DT_42001N_100 | <NA> | <NA> |
5509 | 국가평생교육진흥원 | DT_42001N_100 | 국가평생교육진흥원 | DT_42001N_015 | <NA> | <NA> |
5510 | 국가평생교육진흥원 | DT_42001N_100 | 국가평생교육진흥원 | DT_42001N_020 | <NA> | <NA> |
5511 | 국가평생교육진흥원 | DT_42001N_100 | 국가평생교육진흥원 | DT_42001N_101 | <NA> | <NA> |
5512 | 국가평생교육진흥원 | DT_42001N_100 | 국가평생교육진흥원 | DT_42001N_102 | <NA> | <NA> |
5513 | 국가평생교육진흥원 | DT_42001N_015 | 국가평생교육진흥원 | DT_42001N_100 | <NA> | <NA> |
5514 | 국가평생교육진흥원 | DT_42001N_015 | 국가평생교육진흥원 | DT_42001N_101 | 20 | <NA> |
5515 | 국가평생교육진흥원 | DT_42001N_101 | 국가평생교육진흥원 | DT_42001N_015 | 20 | <NA> |
5516 | 국가평생교육진흥원 | DT_42001N_101 | 국가평생교육진흥원 | DT_42001N_100 | <NA> | <NA> |