Dataset statistics
Number of variables | 14 |
---|---|
Number of observations | 536 |
Missing cells | 942 |
Missing cells (%) | 12.6% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 59.3 KiB |
Average record size in memory | 113.2 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 6 |
Text | 6 |
Boolean | 1 |
Dataset
Description | 한국교통안전공단 철도자격관리시스템의 신체검사 데이터, 적성검사 데이터, 교욱훈련기관 데이터 등 철도 유관기관 데이터 입니다. |
---|---|
Author | 한국교통안전공단 |
URL | https://www.data.go.kr/data/15064519/fileData.do |
대분류 has constant value "" | Constant |
영문 테이블명 has constant value "" | Constant |
한글 테이블명 has constant value "" | Constant |
지역코드 is highly overall correlated with 소재지 | High correlation |
소재지 is highly overall correlated with 지역코드 | High correlation |
유관기관 종류코드 is highly imbalanced (54.3%) | Imbalance |
주소 has 219 (40.9%) missing values | Missing |
상세주소 has 278 (51.9%) missing values | Missing |
우편번호 has 242 (45.1%) missing values | Missing |
대표전화번호 has 203 (37.9%) missing values | Missing |
순번 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 13:14:19.584920 |
---|---|
Analysis finished | 2023-12-12 13:14:21.452734 |
Duration | 1.87 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순번
Real number (ℝ)
UNIQUE
 
Distinct | 536 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 268.5 |
Minimum | 1 |
---|---|
Maximum | 536 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.8 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 27.75 |
Q1 | 134.75 |
median | 268.5 |
Q3 | 402.25 |
95-th percentile | 509.25 |
Maximum | 536 |
Range | 535 |
Interquartile range (IQR) | 267.5 |
Descriptive statistics
Standard deviation | 154.87414 |
---|---|
Coefficient of variation (CV) | 0.57681245 |
Kurtosis | -1.2 |
Mean | 268.5 |
Median Absolute Deviation (MAD) | 134 |
Skewness | 0 |
Sum | 143916 |
Variance | 23986 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.2% |
354 | 1 | 0.2% |
368 | 1 | 0.2% |
367 | 1 | 0.2% |
366 | 1 | 0.2% |
365 | 1 | 0.2% |
364 | 1 | 0.2% |
363 | 1 | 0.2% |
362 | 1 | 0.2% |
361 | 1 | 0.2% |
Other values (526) | 526 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
536 | 1 | |
535 | 1 | |
534 | 1 | |
533 | 1 | |
532 | 1 | |
531 | 1 | |
530 | 1 | |
529 | 1 | |
528 | 1 | |
527 | 1 |
대분류
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.3 KiB |
유관기관 정보 |
---|
Length
Max length | 7 |
---|---|
Median length | 7 |
Mean length | 7 |
Min length | 7 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 유관기관 정보 |
---|---|
2nd row | 유관기관 정보 |
3rd row | 유관기관 정보 |
4th row | 유관기관 정보 |
5th row | 유관기관 정보 |
Common Values
Value | Count | Frequency (%) |
유관기관 정보 | 536 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
유관기관 | 536 | |
정보 | 536 |
영문 테이블명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.3 KiB |
TB_SM1013, TB_SM1014 |
---|
Length
Max length | 20 |
---|---|
Median length | 20 |
Mean length | 20 |
Min length | 20 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | TB_SM1013, TB_SM1014 |
---|---|
2nd row | TB_SM1013, TB_SM1014 |
3rd row | TB_SM1013, TB_SM1014 |
4th row | TB_SM1013, TB_SM1014 |
5th row | TB_SM1013, TB_SM1014 |
Common Values
Value | Count | Frequency (%) |
TB_SM1013, TB_SM1014 | 536 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
tb_sm1013 | 536 | |
tb_sm1014 | 536 |
한글 테이블명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.3 KiB |
유관기관 |
---|
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 유관기관 |
---|---|
2nd row | 유관기관 |
3rd row | 유관기관 |
4th row | 유관기관 |
5th row | 유관기관 |
Common Values
Value | Count | Frequency (%) |
유관기관 | 536 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
유관기관 | 536 |
유관기관 종류코드
Categorical
IMBALANCE
 
Distinct | 14 |
---|---|
Distinct (%) | 2.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.3 KiB |
SM012102 | |
---|---|
SM012303 | |
SM012301 | |
SM012002 | 22 |
SM012103 | 18 |
Other values (9) | 20 |
Length
Max length | 8 |
---|---|
Median length | 8 |
Mean length | 7.9925373 |
Min length | 4 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 0.7% |
Sample
1st row | SM012102 |
---|---|
2nd row | SM012102 |
3rd row | SM012301 |
4th row | SM012102 |
5th row | SM012102 |
Common Values
Value | Count | Frequency (%) |
SM012102 | 348 | |
SM012303 | 92 | 17.2% |
SM012301 | 36 | 6.7% |
SM012002 | 22 | 4.1% |
SM012103 | 18 | 3.4% |
SM012900 | 5 | 0.9% |
SM012104 | 4 | 0.7% |
SM012302 | 3 | 0.6% |
SM012003 | 2 | 0.4% |
SM012201 | 2 | 0.4% |
Other values (4) | 4 | 0.7% |
Length
Value | Count | Frequency (%) |
sm012102 | 348 | |
sm012303 | 92 | 17.2% |
sm012301 | 36 | 6.7% |
sm012002 | 22 | 4.1% |
sm012103 | 18 | 3.4% |
sm012900 | 5 | 0.9% |
sm012104 | 4 | 0.7% |
sm012302 | 3 | 0.6% |
sm012003 | 2 | 0.4% |
sm012201 | 2 | 0.4% |
Other values (4) | 4 | 0.7% |
기관코드
Text
Distinct | 534 |
---|---|
Distinct (%) | 99.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.3 KiB |
Value | Count | Frequency (%) |
1052 | 2 | 0.4% |
6001 | 2 | 0.4% |
1013 | 1 | 0.2% |
000a1045 | 1 | 0.2% |
2009-h08 | 1 | 0.2% |
2009-h24 | 1 | 0.2% |
2009-h01 | 1 | 0.2% |
2009-h02 | 1 | 0.2% |
2009-h03 | 1 | 0.2% |
2009-h07 | 1 | 0.2% |
Other values (524) | 524 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 1074 | |
2 | 585 | |
1 | 560 | |
- | 359 | 9.6% |
H | 357 | 9.6% |
7 | 133 | 3.6% |
6 | 120 | 3.2% |
4 | 118 | 3.2% |
3 | 111 | 3.0% |
9 | 97 | 2.6% |
Other values (5) | 218 | 5.8% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 2970 | |
Uppercase Letter | 403 | 10.8% |
Dash Punctuation | 359 | 9.6% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 1074 | |
2 | 585 | |
1 | 560 | |
7 | 133 | 4.5% |
6 | 120 | 4.0% |
4 | 118 | 4.0% |
3 | 111 | 3.7% |
9 | 97 | 3.3% |
5 | 92 | 3.1% |
8 | 80 | 2.7% |
Uppercase Letter
Value | Count | Frequency (%) |
H | 357 | |
A | 44 | 10.9% |
Z | 1 | 0.2% |
E | 1 | 0.2% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 359 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 3329 | |
Latin | 403 | 10.8% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 1074 | |
2 | 585 | |
1 | 560 | |
- | 359 | 10.8% |
7 | 133 | 4.0% |
6 | 120 | 3.6% |
4 | 118 | 3.5% |
3 | 111 | 3.3% |
9 | 97 | 2.9% |
5 | 92 | 2.8% |
Latin
Value | Count | Frequency (%) |
H | 357 | |
A | 44 | 10.9% |
Z | 1 | 0.2% |
E | 1 | 0.2% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 3732 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 1074 | |
2 | 585 | |
1 | 560 | |
- | 359 | 9.6% |
H | 357 | 9.6% |
7 | 133 | 3.6% |
6 | 120 | 3.2% |
4 | 118 | 3.2% |
3 | 111 | 3.0% |
9 | 97 | 2.6% |
Other values (5) | 218 | 5.8% |
기관명
Text
Distinct | 525 |
---|---|
Distinct (%) | 97.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.3 KiB |
Value | Count | Frequency (%) |
의료법인 | 33 | 4.0% |
육군 | 27 | 3.3% |
한국교통안전공단 | 24 | 2.9% |
한국건강관리협회 | 15 | 1.8% |
대한산업보건협회 | 11 | 1.3% |
한국의학연구소 | 9 | 1.1% |
공군 | 8 | 1.0% |
근로복지공단 | 8 | 1.0% |
한국철도공사 | 4 | 0.5% |
서울특별시 | 4 | 0.5% |
Other values (634) | 685 |
Most occurring characters
Value | Count | Frequency (%) |
원 | 347 | 6.5% |
294 | 5.5% | |
의 | 246 | 4.6% |
병 | 207 | 3.9% |
대 | 122 | 2.3% |
료 | 119 | 2.2% |
단 | 117 | 2.2% |
한 | 115 | 2.2% |
부 | 108 | 2.0% |
국 | 91 | 1.7% |
Other values (335) | 3532 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4668 | |
Space Separator | 294 | 5.5% |
Decimal Number | 133 | 2.5% |
Close Punctuation | 68 | 1.3% |
Open Punctuation | 68 | 1.3% |
Uppercase Letter | 47 | 0.9% |
Other Symbol | 13 | 0.2% |
Dash Punctuation | 3 | 0.1% |
Other Punctuation | 2 | < 0.1% |
Lowercase Letter | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
원 | 347 | 7.4% |
의 | 246 | 5.3% |
병 | 207 | 4.4% |
대 | 122 | 2.6% |
료 | 119 | 2.5% |
단 | 117 | 2.5% |
한 | 115 | 2.5% |
부 | 108 | 2.3% |
국 | 91 | 1.9% |
재 | 78 | 1.7% |
Other values (300) | 3118 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 10 | |
K | 6 | |
C | 6 | |
G | 4 | 8.5% |
I | 3 | 6.4% |
N | 3 | 6.4% |
M | 2 | 4.3% |
T | 2 | 4.3% |
E | 2 | 4.3% |
R | 2 | 4.3% |
Other values (6) | 7 |
Decimal Number
Value | Count | Frequency (%) |
1 | 25 | |
3 | 19 | |
6 | 15 | |
2 | 15 | |
9 | 13 | |
8 | 13 | |
5 | 12 | |
7 | 11 | |
0 | 10 | 7.5% |
Close Punctuation
Value | Count | Frequency (%) |
) | 67 | |
) | 1 | 1.5% |
Open Punctuation
Value | Count | Frequency (%) |
( | 67 | |
( | 1 | 1.5% |
Lowercase Letter
Value | Count | Frequency (%) |
l | 1 | |
i | 1 |
Space Separator
Value | Count | Frequency (%) |
294 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 13 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3 |
Other Punctuation
Value | Count | Frequency (%) |
. | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4680 | |
Common | 568 | 10.7% |
Latin | 49 | 0.9% |
Han | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
원 | 347 | 7.4% |
의 | 246 | 5.3% |
병 | 207 | 4.4% |
대 | 122 | 2.6% |
료 | 119 | 2.5% |
단 | 117 | 2.5% |
한 | 115 | 2.5% |
부 | 108 | 2.3% |
국 | 91 | 1.9% |
재 | 78 | 1.7% |
Other values (300) | 3130 |
Latin
Value | Count | Frequency (%) |
S | 10 | |
K | 6 | |
C | 6 | |
G | 4 | 8.2% |
I | 3 | 6.1% |
N | 3 | 6.1% |
M | 2 | 4.1% |
T | 2 | 4.1% |
E | 2 | 4.1% |
R | 2 | 4.1% |
Other values (8) | 9 |
Common
Value | Count | Frequency (%) |
294 | ||
) | 67 | 11.8% |
( | 67 | 11.8% |
1 | 25 | 4.4% |
3 | 19 | 3.3% |
6 | 15 | 2.6% |
2 | 15 | 2.6% |
9 | 13 | 2.3% |
8 | 13 | 2.3% |
5 | 12 | 2.1% |
Other values (6) | 28 | 4.9% |
Han
Value | Count | Frequency (%) |
秀 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4667 | |
ASCII | 615 | 11.6% |
None | 15 | 0.3% |
CJK | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
원 | 347 | 7.4% |
의 | 246 | 5.3% |
병 | 207 | 4.4% |
대 | 122 | 2.6% |
료 | 119 | 2.5% |
단 | 117 | 2.5% |
한 | 115 | 2.5% |
부 | 108 | 2.3% |
국 | 91 | 1.9% |
재 | 78 | 1.7% |
Other values (299) | 3117 |
ASCII
Value | Count | Frequency (%) |
294 | ||
) | 67 | 10.9% |
( | 67 | 10.9% |
1 | 25 | 4.1% |
3 | 19 | 3.1% |
6 | 15 | 2.4% |
2 | 15 | 2.4% |
9 | 13 | 2.1% |
8 | 13 | 2.1% |
5 | 12 | 2.0% |
Other values (22) | 75 | 12.2% |
None
Value | Count | Frequency (%) |
㈜ | 13 | |
) | 1 | 6.7% |
( | 1 | 6.7% |
CJK
Value | Count | Frequency (%) |
秀 | 1 |
지역코드
Categorical
HIGH CORRELATION
 
Distinct | 17 |
---|---|
Distinct (%) | 3.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.3 KiB |
SM003101 | |
---|---|
<NA> | |
SM003310 | |
SM003201 | |
SM003205 | |
Other values (12) |
Length
Max length | 8 |
---|---|
Median length | 8 |
Mean length | 7.5298507 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | SM003101 |
---|---|
2nd row | SM003205 |
3rd row | SM003205 |
4th row | SM003101 |
5th row | SM003101 |
Common Values
Value | Count | Frequency (%) |
SM003101 | 175 | |
<NA> | 63 | 11.8% |
SM003310 | 54 | 10.1% |
SM003201 | 39 | 7.3% |
SM003205 | 34 | 6.3% |
SM003202 | 25 | 4.7% |
SM003351 | 25 | 4.7% |
SM003203 | 22 | 4.1% |
SM003352 | 18 | 3.4% |
SM003204 | 17 | 3.2% |
Other values (7) | 64 | 11.9% |
Length
Value | Count | Frequency (%) |
sm003101 | 175 | |
na | 63 | 11.8% |
sm003310 | 54 | 10.1% |
sm003201 | 39 | 7.3% |
sm003205 | 34 | 6.3% |
sm003202 | 25 | 4.7% |
sm003351 | 25 | 4.7% |
sm003203 | 22 | 4.1% |
sm003352 | 18 | 3.4% |
sm003204 | 17 | 3.2% |
Other values (7) | 64 | 11.9% |
주소
Text
MISSING
 
Distinct | 307 |
---|---|
Distinct (%) | 96.8% |
Missing | 219 |
Missing (%) | 40.9% |
Memory size | 4.3 KiB |
Length
Max length | 47 |
---|---|
Median length | 38 |
Mean length | 19.037855 |
Min length | 3 |
Characters and Unicode
Total characters | 6035 |
---|---|
Distinct characters | 305 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 298 ? |
---|---|
Unique (%) | 94.0% |
Sample
1st row | 서울특별시 광진구 능동로 120 |
---|---|
2nd row | 대전광역시 서구 관저동로 158 (관저동 1643) 건양대학교병원 |
3rd row | 서울특별시 강남구 광평로 281 (수서동 715) |
4th row | 서울특별시 용산구 청파로 74 |
5th row | 부산광역시 부산진구 가야대로 767 (부전동) 서면메디칼센터 |
Value | Count | Frequency (%) |
서울특별시 | 40 | 2.9% |
서울 | 30 | 2.2% |
경기도 | 27 | 2.0% |
부산 | 20 | 1.5% |
서구 | 20 | 1.5% |
중구 | 16 | 1.2% |
대전 | 15 | 1.1% |
경상북도 | 14 | 1.0% |
대구 | 14 | 1.0% |
부산광역시 | 13 | 1.0% |
Other values (744) | 1159 |
Most occurring characters
Value | Count | Frequency (%) |
1174 | 19.5% | |
동 | 286 | 4.7% |
구 | 255 | 4.2% |
시 | 222 | 3.7% |
로 | 168 | 2.8% |
1 | 142 | 2.4% |
2 | 137 | 2.3% |
대 | 128 | 2.1% |
서 | 127 | 2.1% |
산 | 105 | 1.7% |
Other values (295) | 3291 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 3864 | |
Space Separator | 1174 | 19.5% |
Decimal Number | 734 | 12.2% |
Close Punctuation | 85 | 1.4% |
Open Punctuation | 85 | 1.4% |
Dash Punctuation | 49 | 0.8% |
Other Punctuation | 38 | 0.6% |
Uppercase Letter | 6 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 286 | 7.4% |
구 | 255 | 6.6% |
시 | 222 | 5.7% |
로 | 168 | 4.3% |
대 | 128 | 3.3% |
서 | 127 | 3.3% |
산 | 105 | 2.7% |
도 | 91 | 2.4% |
경 | 88 | 2.3% |
원 | 84 | 2.2% |
Other values (275) | 2310 |
Decimal Number
Value | Count | Frequency (%) |
1 | 142 | |
2 | 137 | |
3 | 81 | |
7 | 60 | |
5 | 58 | |
9 | 57 | |
6 | 56 | 7.6% |
0 | 55 | 7.5% |
4 | 54 | 7.4% |
8 | 34 | 4.6% |
Uppercase Letter
Value | Count | Frequency (%) |
I | 2 | |
K | 2 | |
S | 1 | |
N | 1 |
Other Punctuation
Value | Count | Frequency (%) |
, | 37 | |
. | 1 | 2.6% |
Space Separator
Value | Count | Frequency (%) |
1174 |
Close Punctuation
Value | Count | Frequency (%) |
) | 85 |
Open Punctuation
Value | Count | Frequency (%) |
( | 85 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 49 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 3864 | |
Common | 2165 | |
Latin | 6 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 286 | 7.4% |
구 | 255 | 6.6% |
시 | 222 | 5.7% |
로 | 168 | 4.3% |
대 | 128 | 3.3% |
서 | 127 | 3.3% |
산 | 105 | 2.7% |
도 | 91 | 2.4% |
경 | 88 | 2.3% |
원 | 84 | 2.2% |
Other values (275) | 2310 |
Common
Value | Count | Frequency (%) |
1174 | ||
1 | 142 | 6.6% |
2 | 137 | 6.3% |
) | 85 | 3.9% |
( | 85 | 3.9% |
3 | 81 | 3.7% |
7 | 60 | 2.8% |
5 | 58 | 2.7% |
9 | 57 | 2.6% |
6 | 56 | 2.6% |
Other values (6) | 230 | 10.6% |
Latin
Value | Count | Frequency (%) |
I | 2 | |
K | 2 | |
S | 1 | |
N | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 3864 | |
ASCII | 2171 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1174 | ||
1 | 142 | 6.5% |
2 | 137 | 6.3% |
) | 85 | 3.9% |
( | 85 | 3.9% |
3 | 81 | 3.7% |
7 | 60 | 2.8% |
5 | 58 | 2.7% |
9 | 57 | 2.6% |
6 | 56 | 2.6% |
Other values (10) | 236 | 10.9% |
Hangul
Value | Count | Frequency (%) |
동 | 286 | 7.4% |
구 | 255 | 6.6% |
시 | 222 | 5.7% |
로 | 168 | 4.3% |
대 | 128 | 3.3% |
서 | 127 | 3.3% |
산 | 105 | 2.7% |
도 | 91 | 2.4% |
경 | 88 | 2.3% |
원 | 84 | 2.2% |
Other values (275) | 2310 |
상세주소
Text
MISSING
 
Distinct | 253 |
---|---|
Distinct (%) | 98.1% |
Missing | 278 |
Missing (%) | 51.9% |
Memory size | 4.3 KiB |
Length
Max length | 39 |
---|---|
Median length | 30 |
Mean length | 10.236434 |
Min length | 1 |
Characters and Unicode
Total characters | 2641 |
---|---|
Distinct characters | 247 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 248 ? |
---|---|
Unique (%) | 96.1% |
Sample
1st row | 8층, 9층(수서동, 효성수서빌딩) |
---|---|
2nd row | 온종합병원 건강검진센터 5층 |
3rd row | 칠곡 경북대학교병원 |
4th row | 충렬대로348번길 1 |
5th row | 9층 |
Value | Count | Frequency (%) |
부산광역시 | 9 | 1.6% |
한국교통안전공단 | 8 | 1.4% |
2층 | 8 | 1.4% |
경기도 | 7 | 1.3% |
남구 | 7 | 1.3% |
서울특별시 | 7 | 1.3% |
4층 | 7 | 1.3% |
3층 | 6 | 1.1% |
5층 | 5 | 0.9% |
대구광역시 | 5 | 0.9% |
Other values (426) | 488 |
Most occurring characters
Value | Count | Frequency (%) |
300 | 11.4% | |
1 | 187 | 7.1% |
- | 140 | 5.3% |
2 | 109 | 4.1% |
3 | 103 | 3.9% |
5 | 89 | 3.4% |
4 | 87 | 3.3% |
동 | 83 | 3.1% |
0 | 66 | 2.5% |
6 | 63 | 2.4% |
Other values (237) | 1414 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1240 | |
Decimal Number | 882 | |
Space Separator | 300 | 11.4% |
Dash Punctuation | 140 | 5.3% |
Uppercase Letter | 21 | 0.8% |
Lowercase Letter | 16 | 0.6% |
Open Punctuation | 15 | 0.6% |
Close Punctuation | 15 | 0.6% |
Other Punctuation | 10 | 0.4% |
Math Symbol | 2 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 83 | 6.7% |
시 | 60 | 4.8% |
구 | 58 | 4.7% |
층 | 55 | 4.4% |
광 | 33 | 2.7% |
역 | 30 | 2.4% |
원 | 26 | 2.1% |
도 | 26 | 2.1% |
서 | 25 | 2.0% |
산 | 23 | 1.9% |
Other values (199) | 821 |
Uppercase Letter
Value | Count | Frequency (%) |
L | 4 | |
B | 3 | |
J | 2 | |
A | 2 | |
S | 2 | |
M | 2 | |
F | 2 | |
N | 1 | 4.8% |
C | 1 | 4.8% |
E | 1 | 4.8% |
Decimal Number
Value | Count | Frequency (%) |
1 | 187 | |
2 | 109 | |
3 | 103 | |
5 | 89 | |
4 | 87 | |
0 | 66 | 7.5% |
6 | 63 | 7.1% |
9 | 62 | 7.0% |
7 | 60 | 6.8% |
8 | 56 | 6.3% |
Lowercase Letter
Value | Count | Frequency (%) |
a | 3 | |
r | 2 | |
n | 2 | |
b | 2 | |
e | 2 | |
v | 1 | 6.2% |
o | 1 | 6.2% |
g | 1 | 6.2% |
u | 1 | 6.2% |
p | 1 | 6.2% |
Other Punctuation
Value | Count | Frequency (%) |
, | 9 | |
? | 1 | 10.0% |
Space Separator
Value | Count | Frequency (%) |
300 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 140 |
Open Punctuation
Value | Count | Frequency (%) |
( | 15 |
Close Punctuation
Value | Count | Frequency (%) |
) | 15 |
Math Symbol
Value | Count | Frequency (%) |
~ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 1364 | |
Hangul | 1240 | |
Latin | 37 | 1.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 83 | 6.7% |
시 | 60 | 4.8% |
구 | 58 | 4.7% |
층 | 55 | 4.4% |
광 | 33 | 2.7% |
역 | 30 | 2.4% |
원 | 26 | 2.1% |
도 | 26 | 2.1% |
서 | 25 | 2.0% |
산 | 23 | 1.9% |
Other values (199) | 821 |
Latin
Value | Count | Frequency (%) |
L | 4 | 10.8% |
B | 3 | 8.1% |
a | 3 | 8.1% |
r | 2 | 5.4% |
J | 2 | 5.4% |
A | 2 | 5.4% |
S | 2 | 5.4% |
n | 2 | 5.4% |
M | 2 | 5.4% |
b | 2 | 5.4% |
Other values (11) | 13 |
Common
Value | Count | Frequency (%) |
300 | ||
1 | 187 | |
- | 140 | |
2 | 109 | 8.0% |
3 | 103 | 7.6% |
5 | 89 | 6.5% |
4 | 87 | 6.4% |
0 | 66 | 4.8% |
6 | 63 | 4.6% |
9 | 62 | 4.5% |
Other values (7) | 158 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 1401 | |
Hangul | 1240 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
300 | ||
1 | 187 | |
- | 140 | |
2 | 109 | 7.8% |
3 | 103 | 7.4% |
5 | 89 | 6.4% |
4 | 87 | 6.2% |
0 | 66 | 4.7% |
6 | 63 | 4.5% |
9 | 62 | 4.4% |
Other values (28) | 195 |
Hangul
Value | Count | Frequency (%) |
동 | 83 | 6.7% |
시 | 60 | 4.8% |
구 | 58 | 4.7% |
층 | 55 | 4.4% |
광 | 33 | 2.7% |
역 | 30 | 2.4% |
원 | 26 | 2.1% |
도 | 26 | 2.1% |
서 | 25 | 2.0% |
산 | 23 | 1.9% |
Other values (199) | 821 |
우편번호
Text
MISSING
 
Distinct | 284 |
---|---|
Distinct (%) | 96.6% |
Missing | 242 |
Missing (%) | 45.1% |
Memory size | 4.3 KiB |
Value | Count | Frequency (%) |
135-880 | 3 | 1.0% |
01902 | 2 | 0.7% |
137-070 | 2 | 0.7% |
16824 | 2 | 0.7% |
133-847 | 2 | 0.7% |
402-200 | 2 | 0.7% |
06349 | 2 | 0.7% |
302-122 | 2 | 0.7% |
706-170 | 2 | 0.7% |
441-821 | 1 | 0.3% |
Other values (274) | 274 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 367 | |
1 | 240 | |
- | 204 | |
3 | 179 | |
2 | 175 | |
4 | 135 | 7.2% |
7 | 134 | 7.1% |
6 | 126 | 6.7% |
8 | 124 | 6.6% |
5 | 116 | 6.2% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 1674 | |
Dash Punctuation | 204 | 10.9% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 367 | |
1 | 240 | |
3 | 179 | |
2 | 175 | |
4 | 135 | 8.1% |
7 | 134 | 8.0% |
6 | 126 | 7.5% |
8 | 124 | 7.4% |
5 | 116 | 6.9% |
9 | 78 | 4.7% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 204 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 1878 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 367 | |
1 | 240 | |
- | 204 | |
3 | 179 | |
2 | 175 | |
4 | 135 | 7.2% |
7 | 134 | 7.1% |
6 | 126 | 6.7% |
8 | 124 | 6.6% |
5 | 116 | 6.2% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 1878 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 367 | |
1 | 240 | |
- | 204 | |
3 | 179 | |
2 | 175 | |
4 | 135 | 7.2% |
7 | 134 | 7.1% |
6 | 126 | 6.7% |
8 | 124 | 6.6% |
5 | 116 | 6.2% |
대표전화번호
Text
MISSING
 
Distinct | 322 |
---|---|
Distinct (%) | 96.7% |
Missing | 203 |
Missing (%) | 37.9% |
Memory size | 4.3 KiB |
Length
Max length | 13 |
---|---|
Median length | 12 |
Mean length | 11.888889 |
Min length | 9 |
Characters and Unicode
Total characters | 3959 |
---|---|
Distinct characters | 11 |
Distinct categories | 2 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 311 ? |
---|---|
Unique (%) | 93.4% |
Sample
1st row | 02-2030-5706 |
---|---|
2nd row | 02-704-9494 |
3rd row | 051-607-0789 |
4th row | 053-200-3100 |
5th row | 043-230-6222 |
Value | Count | Frequency (%) |
02-2247-6633 | 2 | 0.6% |
02-326-1101 | 2 | 0.6% |
032-899-9777 | 2 | 0.6% |
031-270-5912 | 2 | 0.6% |
02-540-0001 | 2 | 0.6% |
031-297-5000 | 2 | 0.6% |
02-919-7075 | 2 | 0.6% |
031-362-3614 | 2 | 0.6% |
02-375-1273 | 2 | 0.6% |
02-2140-6000 | 2 | 0.6% |
Other values (312) | 313 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 762 | |
- | 665 | |
2 | 418 | |
1 | 356 | |
3 | 349 | |
5 | 337 | |
4 | 259 | 6.5% |
6 | 259 | 6.5% |
7 | 231 | 5.8% |
9 | 174 | 4.4% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 3294 | |
Dash Punctuation | 665 | 16.8% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 762 | |
2 | 418 | |
1 | 356 | |
3 | 349 | |
5 | 337 | |
4 | 259 | 7.9% |
6 | 259 | 7.9% |
7 | 231 | 7.0% |
9 | 174 | 5.3% |
8 | 149 | 4.5% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 665 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 3959 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 762 | |
- | 665 | |
2 | 418 | |
1 | 356 | |
3 | 349 | |
5 | 337 | |
4 | 259 | 6.5% |
6 | 259 | 6.5% |
7 | 231 | 5.8% |
9 | 174 | 4.4% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 3959 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 762 | |
- | 665 | |
2 | 418 | |
1 | 356 | |
3 | 349 | |
5 | 337 | |
4 | 259 | 6.5% |
6 | 259 | 6.5% |
7 | 231 | 5.8% |
9 | 174 | 4.4% |
소재지
Categorical
HIGH CORRELATION
 
Distinct | 49 |
---|---|
Distinct (%) | 9.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.3 KiB |
<NA> | |
---|---|
SM003101 | |
SM003201 | |
SM003205 | |
SM003310 | |
Other values (44) |
Length
Max length | 12 |
---|---|
Median length | 8 |
Mean length | 6.2276119 |
Min length | 2 |
Unique
Unique | 26 ? |
---|---|
Unique (%) | 4.9% |
Sample
1st row | SM003101 |
---|---|
2nd row | SM003205 |
3rd row | SM003101 |
4th row | SM003101 |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 203 | |
SM003101 | 65 | 12.1% |
SM003201 | 39 | 7.3% |
SM003205 | 27 | 5.0% |
SM003310 | 27 | 5.0% |
SM003202 | 22 | 4.1% |
SM003203 | 20 | 3.7% |
SM003351 | 17 | 3.2% |
SM003331 | 13 | 2.4% |
SM003352 | 12 | 2.2% |
Other values (39) | 91 |
Length
Value | Count | Frequency (%) |
na | 203 | |
sm003101 | 65 | 11.6% |
sm003201 | 39 | 7.0% |
sm003205 | 27 | 4.8% |
sm003310 | 27 | 4.8% |
sm003202 | 22 | 3.9% |
sm003203 | 20 | 3.6% |
sm003351 | 17 | 3.0% |
sm003331 | 13 | 2.3% |
sm003352 | 12 | 2.1% |
Other values (49) | 115 |
사용여부
Boolean
Distinct | 2 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 668.0 B |
True | |
---|---|
False |
Value | Count | Frequency (%) |
True | 315 | |
False | 221 |
순번 | 유관기관 종류코드 | 지역코드 | 소재지 | 사용여부 | |
---|---|---|---|---|---|
순번 | 1.000 | 0.552 | 0.382 | 0.577 | 0.463 |
유관기관 종류코드 | 0.552 | 1.000 | 0.347 | 0.821 | 0.420 |
지역코드 | 0.382 | 0.347 | 1.000 | 1.000 | 0.342 |
소재지 | 0.577 | 0.821 | 1.000 | 1.000 | 0.000 |
사용여부 | 0.463 | 0.420 | 0.342 | 0.000 | 1.000 |
지역코드 | 사용여부 | 소재지 | 유관기관 종류코드 | |
---|---|---|---|---|
지역코드 | 1.000 | 0.264 | 0.924 | 0.130 |
사용여부 | 0.264 | 1.000 | 0.000 | 0.387 |
소재지 | 0.924 | 0.000 | 1.000 | 0.461 |
유관기관 종류코드 | 0.130 | 0.387 | 0.461 | 1.000 |
순번 | 유관기관 종류코드 | 지역코드 | 소재지 | 사용여부 | |
---|---|---|---|---|---|
순번 | 1.000 | 0.265 | 0.159 | 0.226 | 0.353 |
유관기관 종류코드 | 0.265 | 1.000 | 0.130 | 0.461 | 0.387 |
지역코드 | 0.159 | 0.130 | 1.000 | 0.924 | 0.264 |
소재지 | 0.226 | 0.461 | 0.924 | 1.000 | 0.000 |
사용여부 | 0.353 | 0.387 | 0.264 | 0.000 | 1.000 |
순번 | 대분류 | 영문 테이블명 | 한글 테이블명 | 유관기관 종류코드 | 기관코드 | 기관명 | 지역코드 | 주소 | 상세주소 | 우편번호 | 대표전화번호 | 소재지 | 사용여부 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1 | 유관기관 정보 | TB_SM1013, TB_SM1014 | 유관기관 | SM012102 | 2014-H26 | 건국대학교병원 | SM003101 | 서울특별시 광진구 능동로 120 | <NA> | 143-701 | 02-2030-5706 | SM003101 | N |
1 | 2 | 유관기관 정보 | TB_SM1013, TB_SM1014 | 유관기관 | SM012102 | 2016-H04 | 건양대학교병원 | SM003205 | 대전광역시 서구 관저동로 158 (관저동 1643) 건양대학교병원 | <NA> | 35365 | <NA> | SM003205 | N |
2 | 3 | 유관기관 정보 | TB_SM1013, TB_SM1014 | 유관기관 | SM012301 | 1056 | 수서고속철도(주) | SM003205 | 서울특별시 강남구 광평로 281 (수서동 715) | 8층, 9층(수서동, 효성수서빌딩) | 06349 | <NA> | SM003101 | N |
3 | 4 | 유관기관 정보 | TB_SM1013, TB_SM1014 | 유관기관 | SM012102 | 2015-H01 | 전자랜드의원 | SM003101 | 서울특별시 용산구 청파로 74 | <NA> | 140-878 | 02-704-9494 | SM003101 | Y |
4 | 5 | 유관기관 정보 | TB_SM1013, TB_SM1014 | 유관기관 | SM012102 | 2016-H05 | 온종합병원 | SM003101 | 부산광역시 부산진구 가야대로 767 (부전동) 서면메디칼센터 | 온종합병원 건강검진센터 5층 | <NA> | 051-607-0789 | <NA> | Y |
5 | 6 | 유관기관 정보 | TB_SM1013, TB_SM1014 | 유관기관 | SM012102 | 2016-H09 | 칠곡 경북대학교병원 | SM003202 | 대구광역시 북구 호국로 807 (학정동 474) | 칠곡 경북대학교병원 | 41404 | 053-200-3100 | SM003202 | Y |
6 | 7 | 유관기관 정보 | TB_SM1013, TB_SM1014 | 유관기관 | SM012102 | 2013-H02 | 한마음의료재단 하나병원 | SM003331 | 충청북도 청주시 흥덕구 2순환로 1262 | <NA> | 361-803 | 043-230-6222 | SM003331 | N |
7 | 8 | 유관기관 정보 | TB_SM1013, TB_SM1014 | 유관기관 | SM012102 | 2014-H30 | 부평세림병원 | SM003203 | 인천광역시 부평구 부평대로 175 | <NA> | 403-717 | <NA> | SM003203 | Y |
8 | 9 | 유관기관 정보 | TB_SM1013, TB_SM1014 | 유관기관 | SM012102 | 2015-H13 | 가톨릭관동대학교 국제성모병원 | SM003203 | 인천광역시 중구 우현로50번길 2 (답동 3-1) 답동성당 | <NA> | 22321 | 032-290-3341 | SM003203 | Y |
9 | 10 | 유관기관 정보 | TB_SM1013, TB_SM1014 | 유관기관 | SM012102 | 2014-H13 | 의료법인 강릉고려병원 | SM003320 | 강원도 강릉시 옥가로 30 | <NA> | 210-933 | 033-649-0326 | SM003320 | Y |
순번 | 대분류 | 영문 테이블명 | 한글 테이블명 | 유관기관 종류코드 | 기관코드 | 기관명 | 지역코드 | 주소 | 상세주소 | 우편번호 | 대표전화번호 | 소재지 | 사용여부 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
526 | 527 | 유관기관 정보 | TB_SM1013, TB_SM1014 | 유관기관 | SM012102 | 2015-H19 | 대구박병원 | SM003202 | 대구광역시 북구 대학로 139 (산격동 1291-4) | <NA> | 41535 | <NA> | SM003202 | Y |
527 | 528 | 유관기관 정보 | TB_SM1013, TB_SM1014 | 유관기관 | SM012102 | 2015-H15 | 영동병원 | SM003101 | 서울특별시 동대문구 한천로 4 (장안동 413-1) | <NA> | 02633 | <NA> | SM003101 | Y |
528 | 529 | 유관기관 정보 | TB_SM1013, TB_SM1014 | 유관기관 | SM012102 | 2016-H17 | 권태경내과의원 | SM003201 | 부산광역시 기장군 기장읍 동부리 280-1 | <NA> | <NA> | <NA> | SM003201 | N |
529 | 530 | 유관기관 정보 | TB_SM1013, TB_SM1014 | 유관기관 | SM012102 | 2011-H11 | 의료법인 정산의료재단 효성병원 | SM003331 | 충북 청주시 상당구 금천동 | 162-90번지 | 360-802 | 043-221-0012 | SM003331 | Y |
530 | 531 | 유관기관 정보 | TB_SM1013, TB_SM1014 | 유관기관 | SM012102 | 2011-H12 | 의료법인명지의료재단 명지병원 | SM003310 | 경기 고양시 덕양구 화정동 | 697-1 | 412-270 | 031-810-6114 | SM003310 | N |
531 | 532 | 유관기관 정보 | TB_SM1013, TB_SM1014 | 유관기관 | SM012301 | 2011 | 신분당선(주) | SM003310 | 경기 성남시 분당구 삼평동 | <NA> | 463-400 | 031-8018-7555 | 경기 | Y |
532 | 533 | 유관기관 정보 | TB_SM1013, TB_SM1014 | 유관기관 | SM012102 | 2012-H07 | 푸른미래 내과의원 | SM003202 | 대구광역시 중구 달구벌대로 2095 | 2095 | 700-742 | 053-422-8575 | SM003202 | N |
533 | 534 | 유관기관 정보 | TB_SM1013, TB_SM1014 | 유관기관 | SM012102 | 2012-H13 | 강남고려병원 | SM003101 | 서울특별시 관악구 관악로 242 | <NA> | 151-810 | 02-877-5533 | SM003101 | Y |
534 | 535 | 유관기관 정보 | TB_SM1013, TB_SM1014 | 유관기관 | SM012102 | 2011-H16 | 수진단검사의학과의원 | SM003101 | 서울 성북구 장위동 | 33-34 | 136-140 | 02-919-7076 | SM003101 | N |
535 | 536 | 유관기관 정보 | TB_SM1013, TB_SM1014 | 유관기관 | SM012102 | 2011-H17 | 메트로병원 | SM003201 | 부산 수영구 남천1동 | 05월 24일 | 613-814 | 051-626-0250 | SM003201 | N |