Dataset statistics
Number of variables | 15 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.2 MiB |
Average record size in memory | 130.0 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 1 |
Text | 8 |
Boolean | 2 |
DateTime | 2 |
Dataset
Description | 공공기관이 등록하여 공공데이터포털에서 개방중인 목록 정보(목록명, 목록타입(파일, API), 표준데이터 여부, 국가중점여부, 등록기관, 기관 분류, 분류체계, 등록일, 마지막 수정일) 를 제공합니다. |
---|---|
Author | 공공데이터활용지원센터 |
URL | https://www.data.go.kr/data/15062804/fileData.do |
표준데이터여부 is highly overall correlated with 목록유형 | High correlation |
목록유형 is highly overall correlated with 표준데이터여부 | High correlation |
목록키 is highly overall correlated with 조회수 | High correlation |
조회수 is highly overall correlated with 목록키 | High correlation |
목록유형 is highly imbalanced (76.8%) | Imbalance |
국가중점여부 is highly imbalanced (72.6%) | Imbalance |
표준데이터여부 is highly imbalanced (96.1%) | Imbalance |
조회수 is highly skewed (γ1 = 20.23009052) | Skewed |
목록키 has unique values | Unique |
URL has unique values | Unique |
Reproduction
Analysis started | 2024-04-06 08:34:55.262092 |
---|---|
Analysis finished | 2024-04-06 08:35:01.994057 |
Duration | 6.73 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
목록키
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 14012629 |
Minimum | 2414851 |
---|---|
Maximum | 15127409 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2414851 |
---|---|
5-th percentile | 3074654 |
Q1 | 15045232 |
median | 15085084 |
Q3 | 15119167 |
95-th percentile | 15125466 |
Maximum | 15127409 |
Range | 12712558 |
Interquartile range (IQR) | 73934.75 |
Descriptive statistics
Standard deviation | 3426729.7 |
---|---|
Coefficient of variation (CV) | 0.24454581 |
Kurtosis | 6.3110468 |
Mean | 14012629 |
Median Absolute Deviation (MAD) | 35181 |
Skewness | -2.8824567 |
Sum | 1.4012629 × 1011 |
Variance | 1.1742477 × 1013 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
3068269 | 1 | < 0.1% |
15120152 | 1 | < 0.1% |
15046050 | 1 | < 0.1% |
15052757 | 1 | < 0.1% |
15068943 | 1 | < 0.1% |
15045905 | 1 | < 0.1% |
15124385 | 1 | < 0.1% |
15100225 | 1 | < 0.1% |
15044010 | 1 | < 0.1% |
15118468 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
2414851 | 1 | |
2805258 | 1 | |
3033244 | 1 | |
3033249 | 1 | |
3033255 | 1 | |
3033273 | 1 | |
3033292 | 1 | |
3033301 | 1 | |
3033302 | 1 | |
3033333 | 1 |
Value | Count | Frequency (%) |
15127409 | 1 | |
15127401 | 1 | |
15127399 | 1 | |
15127398 | 1 | |
15127395 | 1 | |
15127394 | 1 | |
15127386 | 1 | |
15127384 | 1 | |
15127381 | 1 | |
15127376 | 1 |
목록유형
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
FILE | |
---|---|
API | 604 |
STD | 42 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9354 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | FILE |
---|---|
2nd row | FILE |
3rd row | FILE |
4th row | FILE |
5th row | FILE |
Common Values
Value | Count | Frequency (%) |
FILE | 9354 | |
API | 604 | 6.0% |
STD | 42 | 0.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
file | 9354 | |
api | 604 | 6.0% |
std | 42 | 0.4% |
목록명
Text
Distinct | 9997 |
---|---|
Distinct (%) | > 99.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 66 |
---|---|
Median length | 52 |
Mean length | 21.1134 |
Min length | 6 |
Characters and Unicode
Total characters | 211134 |
---|---|
Distinct characters | 768 |
Distinct categories | 12 ? |
Distinct scripts | 4 ? |
Distinct blocks | 5 ? |
Unique
Unique | 9994 ? |
---|---|
Unique (%) | 99.9% |
Sample
1st row | 병무청_승선근무예비역 인원배정 명부 |
---|---|
2nd row | 경상북도 포항시_코로나 일일확진자 수 |
3rd row | 해양경찰청_수상안전종합관리_첨부파일관리 |
4th row | 인천광역시 서구_소아과의원 |
5th row | 충청남도_여성새로일하기센터 현황 |
Value | Count | Frequency (%) |
현황 | 2680 | 9.5% |
정보 | 679 | 2.4% |
경기도 | 485 | 1.7% |
및 | 459 | 1.6% |
인천광역시 | 408 | 1.4% |
부산광역시 | 299 | 1.1% |
서울특별시 | 243 | 0.9% |
전라남도 | 240 | 0.8% |
경상남도 | 212 | 0.7% |
전북특별자치도 | 185 | 0.7% |
Other values (14156) | 22431 |
Most occurring characters
Value | Count | Frequency (%) |
18343 | 8.7% | |
_ | 12013 | 5.7% |
시 | 5709 | 2.7% |
현 | 4820 | 2.3% |
황 | 4793 | 2.3% |
도 | 4728 | 2.2% |
정 | 3565 | 1.7% |
보 | 3530 | 1.7% |
국 | 3482 | 1.6% |
공 | 3352 | 1.6% |
Other values (758) | 146799 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 175748 | |
Space Separator | 18343 | 8.7% |
Connector Punctuation | 12013 | 5.7% |
Uppercase Letter | 1822 | 0.9% |
Close Punctuation | 1026 | 0.5% |
Open Punctuation | 1025 | 0.5% |
Decimal Number | 786 | 0.4% |
Lowercase Letter | 267 | 0.1% |
Other Punctuation | 71 | < 0.1% |
Other Symbol | 19 | < 0.1% |
Other values (2) | 14 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 5709 | 3.2% |
현 | 4820 | 2.7% |
황 | 4793 | 2.7% |
도 | 4728 | 2.7% |
정 | 3565 | 2.0% |
보 | 3530 | 2.0% |
국 | 3482 | 2.0% |
공 | 3352 | 1.9% |
기 | 3233 | 1.8% |
광 | 3058 | 1.7% |
Other values (686) | 135478 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 198 | 10.9% |
I | 172 | 9.4% |
D | 132 | 7.2% |
P | 127 | 7.0% |
C | 122 | 6.7% |
A | 113 | 6.2% |
T | 110 | 6.0% |
O | 95 | 5.2% |
R | 83 | 4.6% |
B | 70 | 3.8% |
Other values (15) | 600 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 40 | |
n | 28 | |
a | 26 | |
c | 22 | 8.2% |
i | 21 | 7.9% |
o | 17 | 6.4% |
t | 14 | 5.2% |
s | 12 | 4.5% |
u | 12 | 4.5% |
l | 11 | 4.1% |
Other values (14) | 64 |
Decimal Number
Value | Count | Frequency (%) |
1 | 247 | |
2 | 108 | |
0 | 95 | 12.1% |
3 | 86 | 10.9% |
9 | 73 | 9.3% |
5 | 59 | 7.5% |
4 | 47 | 6.0% |
8 | 36 | 4.6% |
7 | 19 | 2.4% |
6 | 16 | 2.0% |
Other Punctuation
Value | Count | Frequency (%) |
· | 31 | |
/ | 22 | |
, | 7 | 9.9% |
. | 7 | 9.9% |
? | 3 | 4.2% |
& | 1 | 1.4% |
Space Separator
Value | Count | Frequency (%) |
18343 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 12013 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1026 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1025 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 19 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 13 |
Letter Number
Value | Count | Frequency (%) |
Ⅰ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 175764 | |
Common | 33277 | 15.8% |
Latin | 2090 | 1.0% |
Han | 3 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 5709 | 3.2% |
현 | 4820 | 2.7% |
황 | 4793 | 2.7% |
도 | 4728 | 2.7% |
정 | 3565 | 2.0% |
보 | 3530 | 2.0% |
국 | 3482 | 2.0% |
공 | 3352 | 1.9% |
기 | 3233 | 1.8% |
광 | 3058 | 1.7% |
Other values (684) | 135494 |
Latin
Value | Count | Frequency (%) |
S | 198 | 9.5% |
I | 172 | 8.2% |
D | 132 | 6.3% |
P | 127 | 6.1% |
C | 122 | 5.8% |
A | 113 | 5.4% |
T | 110 | 5.3% |
O | 95 | 4.5% |
R | 83 | 4.0% |
B | 70 | 3.3% |
Other values (40) | 868 |
Common
Value | Count | Frequency (%) |
18343 | ||
_ | 12013 | |
) | 1026 | 3.1% |
( | 1025 | 3.1% |
1 | 247 | 0.7% |
2 | 108 | 0.3% |
0 | 95 | 0.3% |
3 | 86 | 0.3% |
9 | 73 | 0.2% |
5 | 59 | 0.2% |
Other values (11) | 202 | 0.6% |
Han
Value | Count | Frequency (%) |
圖 | 1 | |
次 | 1 | |
班 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 175745 | |
ASCII | 35335 | 16.7% |
None | 50 | < 0.1% |
CJK | 3 | < 0.1% |
Number Forms | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
18343 | ||
_ | 12013 | |
) | 1026 | 2.9% |
( | 1025 | 2.9% |
1 | 247 | 0.7% |
S | 198 | 0.6% |
I | 172 | 0.5% |
D | 132 | 0.4% |
P | 127 | 0.4% |
C | 122 | 0.3% |
Other values (59) | 1930 | 5.5% |
Hangul
Value | Count | Frequency (%) |
시 | 5709 | 3.2% |
현 | 4820 | 2.7% |
황 | 4793 | 2.7% |
도 | 4728 | 2.7% |
정 | 3565 | 2.0% |
보 | 3530 | 2.0% |
국 | 3482 | 2.0% |
공 | 3352 | 1.9% |
기 | 3233 | 1.8% |
광 | 3058 | 1.7% |
Other values (683) | 135475 |
None
Value | Count | Frequency (%) |
· | 31 | |
㈜ | 19 |
Number Forms
Value | Count | Frequency (%) |
Ⅰ | 1 |
CJK
Value | Count | Frequency (%) |
圖 | 1 | |
次 | 1 | |
班 | 1 |
목록설명
Text
Distinct | 9834 |
---|---|
Distinct (%) | 98.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 1024 |
---|---|
Median length | 594 |
Mean length | 96.6837 |
Min length | 9 |
Characters and Unicode
Total characters | 966837 |
---|---|
Distinct characters | 1172 |
Distinct categories | 19 ? |
Distinct scripts | 5 ? |
Distinct blocks | 15 ? |
Unique
Unique | 9799 ? |
---|---|
Unique (%) | 98.0% |
Sample
1st row | 승선근무예비역은 전시사변 또는 비상시 국민경제에 긴요한 물자와 군수물자를 수송하기 위한 업무 또는 이와 관련된 업무의 지원을 위하여 소집되어 승선근무하는 병역대체복무제도입니다.<br/>2024년 승선근무예비역에 대하여 해운업체, 수산업체별 인원배정한 명부입니다. |
---|---|
2nd row | 공공데이터 제공 신청에 따른 2020년 포항시 코로나 일일확진자 수(남구, 북구, 총 누적)에 대한 데이터를 제공합니다 |
3rd row | 메타관리시스템 기반 공공데이터 개방계획 수립 및 이행을 위한 수상구조사 시스템의 수상안전종합관리 첨부파일관리 데이터로 파일 ID, 파일생성일, 사용여부 등의 항목을 제공합니다. |
4th row | 인천광역시 서구 소아과의원의 현황에 대한 데이터입니다. 이 데이터는 의원명, 소재지, 전화번호 등에 대한 정보를 제공합니다. |
5th row | 여성새로일하기센터를 명칭, 지정일, 소재지, 전화번호, 종사자 수, 시설규모, 법인명으로 나열하여 개방하고자 합니다. |
Value | Count | Frequency (%) |
대한 | 3599 | 2.0% |
제공합니다 | 3051 | 1.7% |
및 | 2446 | 1.4% |
정보를 | 1997 | 1.1% |
데이터로 | 1979 | 1.1% |
1976 | 1.1% | |
등의 | 1681 | 0.9% |
있습니다 | 1518 | 0.9% |
등 | 1512 | 0.8% |
수 | 1024 | 0.6% |
Other values (48986) | 157186 |
Most occurring characters
Value | Count | Frequency (%) |
170889 | 17.7% | |
, | 36837 | 3.8% |
이 | 12315 | 1.3% |
. | 12298 | 1.3% |
공 | 12122 | 1.3% |
다 | 11324 | 1.2% |
시 | 11262 | 1.2% |
정 | 11073 | 1.1% |
니 | 10553 | 1.1% |
기 | 9752 | 1.0% |
Other values (1162) | 668412 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 649076 | |
Space Separator | 170893 | 17.7% |
Other Punctuation | 61726 | 6.4% |
Lowercase Letter | 24628 | 2.5% |
Decimal Number | 19163 | 2.0% |
Math Symbol | 13782 | 1.4% |
Uppercase Letter | 8492 | 0.9% |
Close Punctuation | 7706 | 0.8% |
Open Punctuation | 7636 | 0.8% |
Dash Punctuation | 1819 | 0.2% |
Other values (9) | 1916 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 12315 | 1.9% |
공 | 12122 | 1.9% |
다 | 11324 | 1.7% |
시 | 11262 | 1.7% |
정 | 11073 | 1.7% |
니 | 10553 | 1.6% |
기 | 9752 | 1.5% |
에 | 9681 | 1.5% |
의 | 9536 | 1.5% |
보 | 9528 | 1.5% |
Other values (1012) | 541930 |
Lowercase Letter
Value | Count | Frequency (%) |
r | 7175 | |
b | 6615 | |
t | 1021 | 4.1% |
o | 971 | 3.9% |
e | 967 | 3.9% |
s | 945 | 3.8% |
a | 792 | 3.2% |
n | 666 | 2.7% |
i | 665 | 2.7% |
p | 593 | 2.4% |
Other values (18) | 4218 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 933 | 11.0% |
I | 899 | 10.6% |
P | 602 | 7.1% |
D | 563 | 6.6% |
A | 521 | 6.1% |
T | 513 | 6.0% |
C | 472 | 5.6% |
R | 402 | 4.7% |
O | 362 | 4.3% |
M | 344 | 4.1% |
Other values (16) | 2881 |
Other Symbol
Value | Count | Frequency (%) |
㎡ | 72 | |
○ | 63 | |
㎥ | 31 | |
㎎ | 23 | 10.0% |
□ | 9 | 3.9% |
㎢ | 6 | 2.6% |
● | 5 | 2.2% |
℃ | 4 | 1.7% |
☎ | 3 | 1.3% |
㎍ | 3 | 1.3% |
Other values (9) | 11 | 4.8% |
Other Punctuation
Value | Count | Frequency (%) |
, | 36837 | |
. | 12298 | 19.9% |
/ | 8043 | 13.0% |
: | 2017 | 3.3% |
· | 749 | 1.2% |
" | 548 | 0.9% |
* | 388 | 0.6% |
※ | 250 | 0.4% |
' | 242 | 0.4% |
? | 134 | 0.2% |
Other values (8) | 220 | 0.4% |
Math Symbol
Value | Count | Frequency (%) |
> | 6578 | |
< | 6393 | |
~ | 519 | 3.8% |
= | 128 | 0.9% |
⊙ | 77 | 0.6% |
+ | 62 | 0.4% |
→ | 18 | 0.1% |
× | 2 | < 0.1% |
∑ | 2 | < 0.1% |
~ | 1 | < 0.1% |
Other values (2) | 2 | < 0.1% |
Other Number
Value | Count | Frequency (%) |
① | 13 | |
② | 12 | |
③ | 11 | |
④ | 5 | 8.8% |
₂ | 4 | 7.0% |
⑤ | 3 | 5.3% |
⑥ | 3 | 5.3% |
₃ | 2 | 3.5% |
⑦ | 1 | 1.8% |
⑨ | 1 | 1.8% |
Other values (2) | 2 | 3.5% |
Decimal Number
Value | Count | Frequency (%) |
2 | 5343 | |
0 | 4227 | |
1 | 3414 | |
3 | 1664 | 8.7% |
4 | 911 | 4.8% |
5 | 826 | 4.3% |
9 | 767 | 4.0% |
6 | 726 | 3.8% |
8 | 663 | 3.5% |
7 | 622 | 3.2% |
Close Punctuation
Value | Count | Frequency (%) |
) | 7479 | |
] | 158 | 2.1% |
」 | 66 | 0.9% |
} | 2 | < 0.1% |
』 | 1 | < 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 7410 | |
[ | 159 | 2.1% |
「 | 64 | 0.8% |
{ | 2 | < 0.1% |
『 | 1 | < 0.1% |
Space Separator
Value | Count | Frequency (%) |
170889 | ||
4 | < 0.1% |
Control
Value | Count | Frequency (%) |
432 | ||
372 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 56 | |
” | 10 | 15.2% |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 45 | |
“ | 10 | 18.2% |
Letter Number
Value | Count | Frequency (%) |
Ⅰ | 9 | |
Ⅱ | 2 | 18.2% |
Modifier Symbol
Value | Count | Frequency (%) |
` | 2 | |
^ | 1 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1819 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 686 |
Currency Symbol
Value | Count | Frequency (%) |
$ | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 649034 | |
Common | 284639 | |
Latin | 33119 | 3.4% |
Han | 43 | < 0.1% |
Greek | 2 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 12315 | 1.9% |
공 | 12122 | 1.9% |
다 | 11324 | 1.7% |
시 | 11262 | 1.7% |
정 | 11073 | 1.7% |
니 | 10553 | 1.6% |
기 | 9752 | 1.5% |
에 | 9681 | 1.5% |
의 | 9536 | 1.5% |
보 | 9528 | 1.5% |
Other values (982) | 541888 |
Common
Value | Count | Frequency (%) |
170889 | ||
, | 36837 | 12.9% |
. | 12298 | 4.3% |
/ | 8043 | 2.8% |
) | 7479 | 2.6% |
( | 7410 | 2.6% |
> | 6578 | 2.3% |
< | 6393 | 2.2% |
2 | 5343 | 1.9% |
0 | 4227 | 1.5% |
Other values (84) | 19142 | 6.7% |
Latin
Value | Count | Frequency (%) |
r | 7175 | |
b | 6615 | |
t | 1021 | 3.1% |
o | 971 | 2.9% |
e | 967 | 2.9% |
s | 945 | 2.9% |
S | 933 | 2.8% |
I | 899 | 2.7% |
a | 792 | 2.4% |
n | 666 | 2.0% |
Other values (44) | 12135 |
Han
Value | Count | Frequency (%) |
班 | 3 | 7.0% |
次 | 3 | 7.0% |
圖 | 3 | 7.0% |
系 | 2 | 4.7% |
內 | 2 | 4.7% |
科 | 2 | 4.7% |
學 | 2 | 4.7% |
非 | 2 | 4.7% |
馬 | 2 | 4.7% |
垂 | 1 | 2.3% |
Other values (21) | 21 |
Greek
Value | Count | Frequency (%) |
μ | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 648860 | |
ASCII | 316088 | |
None | 901 | 0.1% |
Punctuation | 373 | < 0.1% |
Compat Jamo | 173 | < 0.1% |
CJK Compat | 144 | < 0.1% |
Math Operators | 80 | < 0.1% |
Geometric Shapes | 77 | < 0.1% |
Enclosed Alphanum | 51 | < 0.1% |
CJK | 42 | < 0.1% |
Other values (5) | 48 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
170889 | ||
, | 36837 | 11.7% |
. | 12298 | 3.9% |
/ | 8043 | 2.5% |
) | 7479 | 2.4% |
( | 7410 | 2.3% |
r | 7175 | 2.3% |
b | 6615 | 2.1% |
> | 6578 | 2.1% |
< | 6393 | 2.0% |
Other values (84) | 46371 | 14.7% |
Hangul
Value | Count | Frequency (%) |
이 | 12315 | 1.9% |
공 | 12122 | 1.9% |
다 | 11324 | 1.7% |
시 | 11262 | 1.7% |
정 | 11073 | 1.7% |
니 | 10553 | 1.6% |
기 | 9752 | 1.5% |
에 | 9681 | 1.5% |
의 | 9536 | 1.5% |
보 | 9528 | 1.5% |
Other values (973) | 541714 |
None
Value | Count | Frequency (%) |
· | 749 | |
」 | 66 | 7.3% |
「 | 64 | 7.1% |
₂ | 4 | 0.4% |
4 | 0.4% | |
. | 2 | 0.2% |
μ | 2 | 0.2% |
₃ | 2 | 0.2% |
× | 2 | 0.2% |
』 | 1 | 0.1% |
Other values (5) | 5 | 0.6% |
Punctuation
Value | Count | Frequency (%) |
※ | 250 | |
’ | 56 | 15.0% |
‘ | 45 | 12.1% |
“ | 10 | 2.7% |
” | 10 | 2.7% |
… | 2 | 0.5% |
Math Operators
Value | Count | Frequency (%) |
⊙ | 77 | |
∑ | 2 | 2.5% |
∼ | 1 | 1.2% |
Compat Jamo
Value | Count | Frequency (%) |
ㅇ | 77 | |
ㆍ | 52 | |
ㅁ | 37 | |
ㅡ | 3 | 1.7% |
ㅣ | 1 | 0.6% |
ㅋ | 1 | 0.6% |
ㅗ | 1 | 0.6% |
ㄹ | 1 | 0.6% |
CJK Compat
Value | Count | Frequency (%) |
㎡ | 72 | |
㎥ | 31 | |
㎎ | 23 | 16.0% |
㎢ | 6 | 4.2% |
㎍ | 3 | 2.1% |
㎘ | 2 | 1.4% |
㎝ | 2 | 1.4% |
㎜ | 1 | 0.7% |
㎧ | 1 | 0.7% |
㎏ | 1 | 0.7% |
Other values (2) | 2 | 1.4% |
Geometric Shapes
Value | Count | Frequency (%) |
○ | 63 | |
□ | 9 | 11.7% |
● | 5 | 6.5% |
Arrows
Value | Count | Frequency (%) |
→ | 18 |
Enclosed Alphanum
Value | Count | Frequency (%) |
① | 13 | |
② | 12 | |
③ | 11 | |
④ | 5 | 9.8% |
⑤ | 3 | 5.9% |
⑥ | 3 | 5.9% |
⑦ | 1 | 2.0% |
⑨ | 1 | 2.0% |
⑧ | 1 | 2.0% |
⑩ | 1 | 2.0% |
Letterlike Symbols
Value | Count | Frequency (%) |
ℓ | 10 | |
℃ | 4 | 28.6% |
Number Forms
Value | Count | Frequency (%) |
Ⅰ | 9 | |
Ⅱ | 2 | 18.2% |
Misc Symbols
Value | Count | Frequency (%) |
☎ | 3 | |
★ | 1 | 25.0% |
CJK
Value | Count | Frequency (%) |
班 | 3 | 7.1% |
次 | 3 | 7.1% |
圖 | 3 | 7.1% |
系 | 2 | 4.8% |
內 | 2 | 4.8% |
科 | 2 | 4.8% |
學 | 2 | 4.8% |
非 | 2 | 4.8% |
馬 | 2 | 4.8% |
垂 | 1 | 2.4% |
Other values (20) | 20 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
律 | 1 |
조회수
Real number (ℝ)
HIGH CORRELATION
  SKEWED
 
Distinct | 3795 |
---|---|
Distinct (%) | 38.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2098.8186 |
Minimum | 2 |
---|---|
Maximum | 227546 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2 |
---|---|
5-th percentile | 58 |
Q1 | 232.75 |
median | 1706.5 |
Q3 | 2616 |
95-th percentile | 4820 |
Maximum | 227546 |
Range | 227544 |
Interquartile range (IQR) | 2383.25 |
Descriptive statistics
Standard deviation | 5307.1581 |
---|---|
Coefficient of variation (CV) | 2.5286407 |
Kurtosis | 627.39759 |
Mean | 2098.8186 |
Median Absolute Deviation (MAD) | 1235 |
Skewness | 20.230091 |
Sum | 20988186 |
Variance | 28165927 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
72 | 27 | 0.3% |
74 | 27 | 0.3% |
76 | 26 | 0.3% |
65 | 26 | 0.3% |
82 | 26 | 0.3% |
92 | 25 | 0.2% |
77 | 24 | 0.2% |
83 | 24 | 0.2% |
84 | 24 | 0.2% |
45 | 24 | 0.2% |
Other values (3785) | 9747 |
Value | Count | Frequency (%) |
2 | 1 | < 0.1% |
5 | 1 | < 0.1% |
6 | 4 | |
7 | 1 | < 0.1% |
8 | 5 | |
9 | 2 | < 0.1% |
10 | 6 | |
11 | 2 | < 0.1% |
12 | 3 | |
13 | 3 |
Value | Count | Frequency (%) |
227546 | 1 | |
197396 | 1 | |
129362 | 1 | |
116657 | 1 | |
97162 | 1 | |
94676 | 1 | |
88132 | 1 | |
84617 | 1 | |
84543 | 1 | |
72928 | 1 |
분류체계
Text
Distinct | 74 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 22 |
---|---|
Median length | 20 |
Mean length | 12.6692 |
Min length | 7 |
Characters and Unicode
Total characters | 126692 |
---|---|
Distinct characters | 139 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 3 ? |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 국방 - 병무행정 |
---|---|
2nd row | 보건 - 보건의료 |
3rd row | 공공질서및안전 - 해경 |
4th row | 보건 - 보건의료 |
5th row | 사회복지 - 보육·가족및여성 |
Value | Count | Frequency (%) |
10000 | ||
일반공공행정 | 1724 | 5.7% |
일반행정 | 1107 | 3.7% |
산업·통상·중소기업 | 1075 | 3.6% |
교통및물류 | 949 | 3.2% |
문화체육관광 | 867 | 2.9% |
사회복지 | 866 | 2.9% |
환경 | 853 | 2.8% |
보건 | 785 | 2.6% |
지역개발 | 738 | 2.5% |
Other values (81) | 11036 |
Most occurring characters
Value | Count | Frequency (%) |
20000 | 15.8% | |
- | 10000 | 7.9% |
· | 4707 | 3.7% |
공 | 4694 | 3.7% |
일 | 4284 | 3.4% |
반 | 4210 | 3.3% |
업 | 3930 | 3.1% |
정 | 3639 | 2.9% |
지 | 3288 | 2.6% |
행 | 3012 | 2.4% |
Other values (129) | 64928 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 91985 | |
Space Separator | 20000 | 15.8% |
Dash Punctuation | 10000 | 7.9% |
Other Punctuation | 4707 | 3.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
공 | 4694 | 5.1% |
일 | 4284 | 4.7% |
반 | 4210 | 4.6% |
업 | 3930 | 4.3% |
정 | 3639 | 4.0% |
지 | 3288 | 3.6% |
행 | 3012 | 3.3% |
및 | 2779 | 3.0% |
기 | 2389 | 2.6% |
통 | 2373 | 2.6% |
Other values (126) | 57387 |
Space Separator
Value | Count | Frequency (%) |
20000 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 10000 |
Other Punctuation
Value | Count | Frequency (%) |
· | 4707 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 91985 | |
Common | 34707 | 27.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
공 | 4694 | 5.1% |
일 | 4284 | 4.7% |
반 | 4210 | 4.6% |
업 | 3930 | 4.3% |
정 | 3639 | 4.0% |
지 | 3288 | 3.6% |
행 | 3012 | 3.3% |
및 | 2779 | 3.0% |
기 | 2389 | 2.6% |
통 | 2373 | 2.6% |
Other values (126) | 57387 |
Common
Value | Count | Frequency (%) |
20000 | ||
- | 10000 | |
· | 4707 | 13.6% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 91985 | |
ASCII | 30000 | 23.7% |
None | 4707 | 3.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
20000 | ||
- | 10000 |
None
Value | Count | Frequency (%) |
· | 4707 |
Hangul
Value | Count | Frequency (%) |
공 | 4694 | 5.1% |
일 | 4284 | 4.7% |
반 | 4210 | 4.6% |
업 | 3930 | 4.3% |
정 | 3639 | 4.0% |
지 | 3288 | 3.6% |
행 | 3012 | 3.3% |
및 | 2779 | 3.0% |
기 | 2389 | 2.6% |
통 | 2373 | 2.6% |
Other values (126) | 57387 |
기관코드
Text
Distinct | 676 |
---|---|
Distinct (%) | 6.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
6540000 | 234 | 2.3% |
b554334 | 219 | 2.2% |
6290000 | 166 | 1.7% |
1741000 | 164 | 1.6% |
6280000 | 156 | 1.6% |
3560000 | 131 | 1.3% |
1613000 | 130 | 1.3% |
6500000 | 119 | 1.2% |
b190016 | 106 | 1.1% |
6410000 | 102 | 1.0% |
Other values (666) | 8473 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 28275 | |
5 | 8788 | 12.6% |
1 | 5605 | 8.0% |
3 | 5592 | 8.0% |
4 | 5052 | 7.2% |
6 | 3840 | 5.5% |
2 | 3238 | 4.6% |
B | 3108 | 4.4% |
9 | 2260 | 3.2% |
8 | 2016 | 2.9% |
Other values (3) | 2226 | 3.2% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 66595 | |
Uppercase Letter | 3405 | 4.9% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 28275 | |
5 | 8788 | 13.2% |
1 | 5605 | 8.4% |
3 | 5592 | 8.4% |
4 | 5052 | 7.6% |
6 | 3840 | 5.8% |
2 | 3238 | 4.9% |
9 | 2260 | 3.4% |
8 | 2016 | 3.0% |
7 | 1929 | 2.9% |
Uppercase Letter
Value | Count | Frequency (%) |
B | 3108 | |
A | 294 | 8.6% |
C | 3 | 0.1% |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 66595 | |
Latin | 3405 | 4.9% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 28275 | |
5 | 8788 | 13.2% |
1 | 5605 | 8.4% |
3 | 5592 | 8.4% |
4 | 5052 | 7.6% |
6 | 3840 | 5.8% |
2 | 3238 | 4.9% |
9 | 2260 | 3.4% |
8 | 2016 | 3.0% |
7 | 1929 | 2.9% |
Latin
Value | Count | Frequency (%) |
B | 3108 | |
A | 294 | 8.6% |
C | 3 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 70000 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 28275 | |
5 | 8788 | 12.6% |
1 | 5605 | 8.0% |
3 | 5592 | 8.0% |
4 | 5052 | 7.2% |
6 | 3840 | 5.5% |
2 | 3238 | 4.6% |
B | 3108 | 4.4% |
9 | 2260 | 3.2% |
8 | 2016 | 2.9% |
Other values (3) | 2226 | 3.2% |
기관명
Text
Distinct | 676 |
---|---|
Distinct (%) | 6.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
경기도 | 679 | 4.8% |
인천광역시 | 585 | 4.2% |
전북특별자치도 | 543 | 3.9% |
부산광역시 | 536 | 3.8% |
전라남도 | 365 | 2.6% |
서울특별시 | 348 | 2.5% |
경상남도 | 316 | 2.2% |
서구 | 314 | 2.2% |
충청남도 | 268 | 1.9% |
광주광역시 | 249 | 1.8% |
Other values (645) | 9843 |
Most occurring characters
Value | Count | Frequency (%) |
시 | 4075 | 5.4% |
4046 | 5.4% | |
도 | 3431 | 4.5% |
광 | 2742 | 3.6% |
국 | 2701 | 3.6% |
역 | 2142 | 2.8% |
구 | 2072 | 2.7% |
공 | 2059 | 2.7% |
부 | 1932 | 2.6% |
전 | 1862 | 2.5% |
Other values (269) | 48364 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 70827 | |
Space Separator | 4046 | 5.4% |
Close Punctuation | 245 | 0.3% |
Open Punctuation | 245 | 0.3% |
Uppercase Letter | 36 | < 0.1% |
Other Symbol | 19 | < 0.1% |
Decimal Number | 6 | < 0.1% |
Other Punctuation | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 4075 | 5.8% |
도 | 3431 | 4.8% |
광 | 2742 | 3.9% |
국 | 2701 | 3.8% |
역 | 2142 | 3.0% |
구 | 2072 | 2.9% |
공 | 2059 | 2.9% |
부 | 1932 | 2.7% |
전 | 1862 | 2.6% |
경 | 1733 | 2.4% |
Other values (259) | 46078 |
Uppercase Letter
Value | Count | Frequency (%) |
N | 12 | |
D | 12 | |
K | 12 |
Decimal Number
Value | Count | Frequency (%) |
2 | 4 | |
8 | 2 |
Space Separator
Value | Count | Frequency (%) |
4046 |
Close Punctuation
Value | Count | Frequency (%) |
) | 245 |
Open Punctuation
Value | Count | Frequency (%) |
( | 245 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 19 |
Other Punctuation
Value | Count | Frequency (%) |
. | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 70846 | |
Common | 4544 | 6.0% |
Latin | 36 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 4075 | 5.8% |
도 | 3431 | 4.8% |
광 | 2742 | 3.9% |
국 | 2701 | 3.8% |
역 | 2142 | 3.0% |
구 | 2072 | 2.9% |
공 | 2059 | 2.9% |
부 | 1932 | 2.7% |
전 | 1862 | 2.6% |
경 | 1733 | 2.4% |
Other values (260) | 46097 |
Common
Value | Count | Frequency (%) |
4046 | ||
) | 245 | 5.4% |
( | 245 | 5.4% |
2 | 4 | 0.1% |
8 | 2 | < 0.1% |
. | 2 | < 0.1% |
Latin
Value | Count | Frequency (%) |
N | 12 | |
D | 12 | |
K | 12 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 70827 | |
ASCII | 4580 | 6.1% |
None | 19 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
시 | 4075 | 5.8% |
도 | 3431 | 4.8% |
광 | 2742 | 3.9% |
국 | 2701 | 3.8% |
역 | 2142 | 3.0% |
구 | 2072 | 2.9% |
공 | 2059 | 2.9% |
부 | 1932 | 2.7% |
전 | 1862 | 2.6% |
경 | 1733 | 2.4% |
Other values (259) | 46078 |
ASCII
Value | Count | Frequency (%) |
4046 | ||
) | 245 | 5.3% |
( | 245 | 5.3% |
N | 12 | 0.3% |
D | 12 | 0.3% |
K | 12 | 0.3% |
2 | 4 | 0.1% |
8 | 2 | < 0.1% |
. | 2 | < 0.1% |
None
Value | Count | Frequency (%) |
㈜ | 19 |
국가중점여부
Boolean
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 87.9 KiB |
False | |
---|---|
True | 472 |
Value | Count | Frequency (%) |
False | 9528 | |
True | 472 | 4.7% |
표준데이터여부
Boolean
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 87.9 KiB |
False | |
---|---|
True | 42 |
Value | Count | Frequency (%) |
False | 9958 | |
True | 42 | 0.4% |
목록 등록일
Date
Distinct | 1738 |
---|---|
Distinct (%) | 17.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2011-12-03 00:00:00 |
---|---|
Maximum | 2024-03-28 00:00:00 |
목록 수정일
Date
Distinct | 215 |
---|---|
Distinct (%) | 2.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2023-08-11 00:00:00 |
---|---|
Maximum | 2024-03-29 00:00:00 |
URL
Text
UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 48 |
---|---|
Median length | 48 |
Mean length | 47.8504 |
Min length | 46 |
Characters and Unicode
Total characters | 478504 |
---|---|
Distinct characters | 30 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 10000 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | https://www.data.go.kr/data/3068269/fileData.do |
---|---|
2nd row | https://www.data.go.kr/data/15121131/fileData.do |
3rd row | https://www.data.go.kr/data/15118343/fileData.do |
4th row | https://www.data.go.kr/data/15086609/fileData.do |
5th row | https://www.data.go.kr/data/15095087/fileData.do |
Value | Count | Frequency (%) |
https://www.data.go.kr/data/3068269/filedata.do | 1 | < 0.1% |
https://www.data.go.kr/data/15100225/filedata.do | 1 | < 0.1% |
https://www.data.go.kr/data/15119812/filedata.do | 1 | < 0.1% |
https://www.data.go.kr/data/15106012/filedata.do | 1 | < 0.1% |
https://www.data.go.kr/data/15046050/filedata.do | 1 | < 0.1% |
https://www.data.go.kr/data/15052757/filedata.do | 1 | < 0.1% |
https://www.data.go.kr/data/15068943/filedata.do | 1 | < 0.1% |
https://www.data.go.kr/data/15045905/filedata.do | 1 | < 0.1% |
https://www.data.go.kr/data/15124385/filedata.do | 1 | < 0.1% |
https://www.data.go.kr/data/15120152/filedata.do | 1 | < 0.1% |
Other values (9990) | 9990 |
Most occurring characters
Value | Count | Frequency (%) |
a | 59396 | 12.4% |
/ | 50000 | 10.4% |
t | 49396 | 10.3% |
. | 40000 | 8.4% |
d | 30084 | 6.3% |
w | 30000 | 6.3% |
o | 20604 | 4.3% |
1 | 18201 | 3.8% |
5 | 13904 | 2.9% |
p | 11208 | 2.3% |
Other values (20) | 155711 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 290042 | |
Other Punctuation | 100000 | 20.9% |
Decimal Number | 79108 | 16.5% |
Uppercase Letter | 9354 | 2.0% |
Most frequent character per category
Lowercase Letter
Value | Count | Frequency (%) |
a | 59396 | |
t | 49396 | |
d | 30084 | |
w | 30000 | |
o | 20604 | 7.1% |
p | 11208 | 3.9% |
r | 10042 | 3.5% |
s | 10042 | 3.5% |
h | 10000 | 3.4% |
k | 10000 | 3.4% |
Other values (6) | 49270 |
Decimal Number
Value | Count | Frequency (%) |
1 | 18201 | |
5 | 13904 | |
0 | 11148 | |
2 | 6347 | 8.0% |
3 | 5607 | 7.1% |
4 | 5110 | 6.5% |
9 | 4798 | 6.1% |
6 | 4760 | 6.0% |
8 | 4740 | 6.0% |
7 | 4493 | 5.7% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 50000 | |
. | 40000 | |
: | 10000 | 10.0% |
Uppercase Letter
Value | Count | Frequency (%) |
D | 9354 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 299396 | |
Common | 179108 |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
a | 59396 | |
t | 49396 | |
d | 30084 | |
w | 30000 | |
o | 20604 | 6.9% |
p | 11208 | 3.7% |
r | 10042 | 3.4% |
s | 10042 | 3.4% |
h | 10000 | 3.3% |
k | 10000 | 3.3% |
Other values (7) | 58624 |
Common
Value | Count | Frequency (%) |
/ | 50000 | |
. | 40000 | |
1 | 18201 | 10.2% |
5 | 13904 | 7.8% |
0 | 11148 | 6.2% |
: | 10000 | 5.6% |
2 | 6347 | 3.5% |
3 | 5607 | 3.1% |
4 | 5110 | 2.9% |
9 | 4798 | 2.7% |
Other values (3) | 13993 | 7.8% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 478504 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
a | 59396 | 12.4% |
/ | 50000 | 10.4% |
t | 49396 | 10.3% |
. | 40000 | 8.4% |
d | 30084 | 6.3% |
w | 30000 | 6.3% |
o | 20604 | 4.3% |
1 | 18201 | 3.8% |
5 | 13904 | 2.9% |
p | 11208 | 2.3% |
Other values (20) | 155711 |
다운로드_활용건수
Text
Distinct | 2056 |
---|---|
Distinct (%) | 20.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
24 | 92 | 0.9% |
2 | 91 | 0.9% |
23 | 83 | 0.8% |
0 | 81 | 0.8% |
25 | 77 | 0.8% |
1 | 76 | 0.8% |
22 | 71 | 0.7% |
3 | 71 | 0.7% |
21 | 67 | 0.7% |
26 | 58 | 0.6% |
Other values (2046) | 9233 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 4587 | |
2 | 3716 | |
3 | 2869 | |
5 | 2692 | |
6 | 2690 | |
4 | 2608 | |
7 | 2541 | |
8 | 2286 | |
0 | 2226 | |
9 | 2089 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 28304 | |
Dash Punctuation | 18 | 0.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 4587 | |
2 | 3716 | |
3 | 2869 | |
5 | 2692 | |
6 | 2690 | |
4 | 2608 | |
7 | 2541 | |
8 | 2286 | |
0 | 2226 | |
9 | 2089 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 18 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 28322 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 4587 | |
2 | 3716 | |
3 | 2869 | |
5 | 2692 | |
6 | 2690 | |
4 | 2608 | |
7 | 2541 | |
8 | 2286 | |
0 | 2226 | |
9 | 2089 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 28322 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 4587 | |
2 | 3716 | |
3 | 2869 | |
5 | 2692 | |
6 | 2690 | |
4 | 2608 | |
7 | 2541 | |
8 | 2286 | |
0 | 2226 | |
9 | 2089 |
키워드
Text
Distinct | 9699 |
---|---|
Distinct (%) | 97.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 52 |
---|---|
Median length | 42 |
Mean length | 13.6636 |
Min length | 6 |
Characters and Unicode
Total characters | 136636 |
---|---|
Distinct characters | 791 |
Distinct categories | 12 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 9557 ? |
---|---|
Unique (%) | 95.6% |
Sample
1st row | 승선근무예비역,인원배정,명부 |
---|---|
2nd row | 보건,감염,통계 |
3rd row | 수상구조사,국가자격,첨부파일관리 |
4th row | 병원,의원,소아과 |
5th row | 여성,일자리센터,구직 |
Value | Count | Frequency (%) |
국회,입법,의안 | 66 | 0.5% |
및 | 59 | 0.5% |
현황 | 56 | 0.5% |
정보 | 54 | 0.4% |
부동산거래 | 45 | 0.4% |
가맹본부,본부,브랜드 | 34 | 0.3% |
수 | 18 | 0.1% |
위치 | 12 | 0.1% |
거래규모별 | 11 | 0.1% |
건축물거래 | 11 | 0.1% |
Other values (11064) | 11887 |
Most occurring characters
Value | Count | Frequency (%) |
, | 20009 | 14.6% |
지 | 2695 | 2.0% |
기 | 2351 | 1.7% |
2255 | 1.7% | |
업 | 2004 | 1.5% |
사 | 1992 | 1.5% |
정 | 1981 | 1.4% |
시 | 1921 | 1.4% |
보 | 1900 | 1.4% |
도 | 1878 | 1.4% |
Other values (781) | 97650 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 112152 | |
Other Punctuation | 20098 | 14.7% |
Space Separator | 2255 | 1.7% |
Uppercase Letter | 1301 | 1.0% |
Decimal Number | 634 | 0.5% |
Lowercase Letter | 139 | 0.1% |
Open Punctuation | 19 | < 0.1% |
Close Punctuation | 19 | < 0.1% |
Connector Punctuation | 7 | < 0.1% |
Dash Punctuation | 6 | < 0.1% |
Other values (2) | 6 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
지 | 2695 | 2.4% |
기 | 2351 | 2.1% |
업 | 2004 | 1.8% |
사 | 1992 | 1.8% |
정 | 1981 | 1.8% |
시 | 1921 | 1.7% |
보 | 1900 | 1.7% |
도 | 1878 | 1.7% |
수 | 1854 | 1.7% |
공 | 1683 | 1.5% |
Other values (709) | 91893 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 135 | 10.4% |
I | 132 | 10.1% |
S | 126 | 9.7% |
D | 117 | 9.0% |
A | 96 | 7.4% |
T | 90 | 6.9% |
O | 71 | 5.5% |
P | 70 | 5.4% |
V | 49 | 3.8% |
E | 46 | 3.5% |
Other values (15) | 369 |
Lowercase Letter
Value | Count | Frequency (%) |
n | 13 | 9.4% |
o | 12 | 8.6% |
s | 11 | 7.9% |
i | 10 | 7.2% |
e | 10 | 7.2% |
p | 9 | 6.5% |
c | 9 | 6.5% |
d | 9 | 6.5% |
g | 8 | 5.8% |
a | 8 | 5.8% |
Other values (12) | 40 |
Decimal Number
Value | Count | Frequency (%) |
1 | 223 | |
2 | 84 | 13.2% |
3 | 83 | 13.1% |
9 | 72 | 11.4% |
0 | 58 | 9.1% |
5 | 44 | 6.9% |
4 | 29 | 4.6% |
6 | 18 | 2.8% |
7 | 13 | 2.1% |
8 | 10 | 1.6% |
Other Punctuation
Value | Count | Frequency (%) |
, | 20009 | |
@ | 40 | 0.2% |
/ | 29 | 0.1% |
· | 10 | < 0.1% |
. | 8 | < 0.1% |
! | 1 | < 0.1% |
& | 1 | < 0.1% |
Math Symbol
Value | Count | Frequency (%) |
| | 4 | |
~ | 1 | 20.0% |
Space Separator
Value | Count | Frequency (%) |
2255 |
Open Punctuation
Value | Count | Frequency (%) |
( | 19 |
Close Punctuation
Value | Count | Frequency (%) |
) | 19 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 7 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 6 |
Control
Value | Count | Frequency (%) |
1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 112152 | |
Common | 23044 | 16.9% |
Latin | 1440 | 1.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
지 | 2695 | 2.4% |
기 | 2351 | 2.1% |
업 | 2004 | 1.8% |
사 | 1992 | 1.8% |
정 | 1981 | 1.8% |
시 | 1921 | 1.7% |
보 | 1900 | 1.7% |
도 | 1878 | 1.7% |
수 | 1854 | 1.7% |
공 | 1683 | 1.5% |
Other values (709) | 91893 |
Latin
Value | Count | Frequency (%) |
C | 135 | 9.4% |
I | 132 | 9.2% |
S | 126 | 8.8% |
D | 117 | 8.1% |
A | 96 | 6.7% |
T | 90 | 6.2% |
O | 71 | 4.9% |
P | 70 | 4.9% |
V | 49 | 3.4% |
E | 46 | 3.2% |
Other values (37) | 508 |
Common
Value | Count | Frequency (%) |
, | 20009 | |
2255 | 9.8% | |
1 | 223 | 1.0% |
2 | 84 | 0.4% |
3 | 83 | 0.4% |
9 | 72 | 0.3% |
0 | 58 | 0.3% |
5 | 44 | 0.2% |
@ | 40 | 0.2% |
/ | 29 | 0.1% |
Other values (15) | 147 | 0.6% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 112152 | |
ASCII | 24474 | 17.9% |
None | 10 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
, | 20009 | |
2255 | 9.2% | |
1 | 223 | 0.9% |
C | 135 | 0.6% |
I | 132 | 0.5% |
S | 126 | 0.5% |
D | 117 | 0.5% |
A | 96 | 0.4% |
T | 90 | 0.4% |
2 | 84 | 0.3% |
Other values (61) | 1207 | 4.9% |
Hangul
Value | Count | Frequency (%) |
지 | 2695 | 2.4% |
기 | 2351 | 2.1% |
업 | 2004 | 1.8% |
사 | 1992 | 1.8% |
정 | 1981 | 1.8% |
시 | 1921 | 1.7% |
보 | 1900 | 1.7% |
도 | 1878 | 1.7% |
수 | 1854 | 1.7% |
공 | 1683 | 1.5% |
Other values (709) | 91893 |
None
Value | Count | Frequency (%) |
· | 10 |
목록키 | 목록유형 | 조회수 | 분류체계 | 국가중점여부 | 표준데이터여부 | |
---|---|---|---|---|---|---|
목록키 | 1.000 | 0.031 | 0.000 | 0.194 | 0.088 | 0.023 |
목록유형 | 0.031 | 1.000 | 0.471 | 0.458 | 0.158 | 1.000 |
조회수 | 0.000 | 0.471 | 1.000 | 0.000 | 0.094 | 0.624 |
분류체계 | 0.194 | 0.458 | 0.000 | 1.000 | 0.556 | 0.080 |
국가중점여부 | 0.088 | 0.158 | 0.094 | 0.556 | 1.000 | 0.006 |
표준데이터여부 | 0.023 | 1.000 | 0.624 | 0.080 | 0.006 | 1.000 |
표준데이터여부 | 국가중점여부 | 목록유형 | |
---|---|---|---|
표준데이터여부 | 1.000 | 0.004 | 1.000 |
국가중점여부 | 0.004 | 1.000 | 0.260 |
목록유형 | 1.000 | 0.260 | 1.000 |
목록키 | 조회수 | 목록유형 | 국가중점여부 | 표준데이터여부 | |
---|---|---|---|---|---|
목록키 | 1.000 | -0.847 | 0.051 | 0.056 | 0.014 |
조회수 | -0.847 | 1.000 | 0.340 | 0.071 | 0.473 |
목록유형 | 0.051 | 0.340 | 1.000 | 0.260 | 1.000 |
국가중점여부 | 0.056 | 0.071 | 0.260 | 1.000 | 0.004 |
표준데이터여부 | 0.014 | 0.473 | 1.000 | 0.004 | 1.000 |
목록키 | 목록유형 | 목록명 | 목록설명 | 조회수 | 분류체계 | 기관코드 | 기관명 | 국가중점여부 | 표준데이터여부 | 목록 등록일 | 목록 수정일 | URL | 다운로드_활용건수 | 키워드 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
6922 | 3068269 | FILE | 병무청_승선근무예비역 인원배정 명부 | 승선근무예비역은 전시사변 또는 비상시 국민경제에 긴요한 물자와 군수물자를 수송하기 위한 업무 또는 이와 관련된 업무의 지원을 위하여 소집되어 승선근무하는 병역대체복무제도입니다.<br/>2024년 승선근무예비역에 대하여 해운업체, 수산업체별 인원배정한 명부입니다. | 3483 | 국방 - 병무행정 | 1300000 | 병무청 | N | N | 2018-10-11 | 2024-01-19 | https://www.data.go.kr/data/3068269/fileData.do | 2270 | 승선근무예비역,인원배정,명부 |
21473 | 15121131 | FILE | 경상북도 포항시_코로나 일일확진자 수 | 공공데이터 제공 신청에 따른 2020년 포항시 코로나 일일확진자 수(남구, 북구, 총 누적)에 대한 데이터를 제공합니다 | 146 | 보건 - 보건의료 | 5020000 | 경상북도 포항시 | N | N | 2023-08-29 | 2023-08-31 | https://www.data.go.kr/data/15121131/fileData.do | 37 | 보건,감염,통계 |
21038 | 15118343 | FILE | 해양경찰청_수상안전종합관리_첨부파일관리 | 메타관리시스템 기반 공공데이터 개방계획 수립 및 이행을 위한 수상구조사 시스템의 수상안전종합관리 첨부파일관리 데이터로 파일 ID, 파일생성일, 사용여부 등의 항목을 제공합니다. | 146 | 공공질서및안전 - 해경 | 1532000 | 해양경찰청 | N | N | 2023-08-10 | 2023-09-04 | https://www.data.go.kr/data/15118343/fileData.do | 20 | 수상구조사,국가자격,첨부파일관리 |
24102 | 15086609 | FILE | 인천광역시 서구_소아과의원 | 인천광역시 서구 소아과의원의 현황에 대한 데이터입니다. 이 데이터는 의원명, 소재지, 전화번호 등에 대한 정보를 제공합니다. | 1039 | 보건 - 보건의료 | 3560000 | 인천광역시 서구 | N | N | 2021-08-26 | 2023-08-24 | https://www.data.go.kr/data/15086609/fileData.do | 493 | 병원,의원,소아과 |
6848 | 15095087 | FILE | 충청남도_여성새로일하기센터 현황 | 여성새로일하기센터를 명칭, 지정일, 소재지, 전화번호, 종사자 수, 시설규모, 법인명으로 나열하여 개방하고자 합니다. | 965 | 사회복지 - 보육·가족및여성 | 6440000 | 충청남도 | N | N | 2021-11-24 | 2024-01-21 | https://www.data.go.kr/data/15095087/fileData.do | 325 | 여성,일자리센터,구직 |
5794 | 15055535 | FILE | 전북특별자치도_국립공원내 도유재산(토지) 현황 | 국립공원내 도유재산(토지) 현황(재산분류,재산의소재,면적, 위치, 특수지, 본번, 부번, 공시지가, 재산가격, 총 사용허가면적 등) 제공 | 2080 | 일반공공행정 - 국정운영 | 6540000 | 전북특별자치도 | N | N | 2019-09-25 | 2024-01-29 | https://www.data.go.kr/data/15055535/fileData.do | 780 | 국공유재산,국가재산,재산 |
12572 | 15041068 | FILE | 국가철도공단_우이신설_환승정보 | 우이신설에서 운영하는 역사들의 환승정보 데이터로 철도운영기관명, 선명, 역명, 환승철도운영기관, 환승선명, 환승이후역명, 환승기점역명, 차량순서, 차량출입문번호의 데이터가 있습니다. | 2730 | 교통및물류 - 철도 | B554334 | 국가철도공단 | Y | N | 2019-11-22 | 2023-11-09 | https://www.data.go.kr/data/15041068/fileData.do | 1026 | 도시광역철도,환승정보,우이신설지하철 |
8909 | 3036703 | FILE | 경기도 안양시_사업체기초통계 | 전국적으로 실시한 기준 사업체조사를 실시하여 안양시에 해당하는 부문을 발췌하여 수록한 (사업체조사에 관한 종자사수, 조직형테, 사업체구분별) 간행물 데이터정보입니다. | 3011 | 일반공공행정 - 일반행정 | 3830000 | 경기도 안양시 | N | N | 2014-04-01 | 2023-12-22 | https://www.data.go.kr/data/3036703/fileData.do | 2954 | 사업체,조사,행정 |
15781 | 15038511 | FILE | 제주특별자치도교육청_학교현황 | 제주특별자치도 소재 유.초.중.고.특수학교 소재지, 개교일자, 우편번호, 주소, 전화번호, 홈페이지주소 안내 | 3195 | 교육 - 교육일반 | 9290000 | 제주특별자치도교육청 | N | N | 2019-09-05 | 2023-10-04 | https://www.data.go.kr/data/15038511/fileData.do | 1805 | 학교주소,개교일자,학교홈페이지 |
26345 | 15070169 | FILE | 교육부 국립국제교육원_기관홈페이지_메뉴별_뷰카운트 | 국립국제교육원 기관대표 홈페이지에서 이용 가능한 주요 메뉴들의 메뉴명,접근단계, 방문자수를 집계한 현황 자료로 인기가 많은 순으로 정렬한 것임 | 1758 | 교육 - 교육일반 | 1342090 | 교육부 국립국제교육원 | N | N | 2020-10-19 | 2023-08-17 | https://www.data.go.kr/data/15070169/fileData.do | 637 | 대표홈페이지,주요메뉴,이용현황 |
목록키 | 목록유형 | 목록명 | 목록설명 | 조회수 | 분류체계 | 기관코드 | 기관명 | 국가중점여부 | 표준데이터여부 | 목록 등록일 | 목록 수정일 | URL | 다운로드_활용건수 | 키워드 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
11195 | 15099038 | FILE | 대외경제정책연구원_각국의 대세계 RCA 6단위 | UN Comtrade의 주요 40여개 국가의 무역통계를 사용하여 해당년도 HS 기준(6단위)으로 현시비교우위(RCA)지수를 산출한 DB | 702 | 산업·통상·중소기업 - 통상 | B090003 | 대외경제정책연구원 | N | N | 2022-02-17 | 2023-11-24 | https://www.data.go.kr/data/15099038/fileData.do | 2511 | 무역통계,RCA 6단위,현시비교우위 |
2392 | 15113165 | FILE | 대전광역시 서구_지역아동센터 운영지원현황 | 대전광역시 서구 지역아동센터 운영지원현황(순번, 지원구분명, 예산액, 예산액단위, 대상명, 지원기준, 시기, 재원비율, 데이터기준일자) 입니다. | 177 | 사회복지 - 사회복지일반 | 3660000 | 대전광역시 서구 | N | N | 2023-04-04 | 2024-03-08 | https://www.data.go.kr/data/15113165/fileData.do | 47 | 아동복지,아동보호,아동교육 |
25472 | 15118986 | FILE | 한국환경공단_순환골재 폐기물 데이터 | 순환골재 규격별, 업체별, 연도별 생산, 판매 실적에 대한 데이터를 제공합니다. (세부 업체명은 블라인드 처리되었습니다) | 146 | 환경 - 폐기물 | B552584 | 한국환경공단 | N | N | 2023-08-17 | 2023-08-21 | https://www.data.go.kr/data/15118986/fileData.do | 111 | 순환골재,폐기물,재활용 |
20725 | 15121037 | FILE | 부산교통공사_부산진역 측선 특수촬영본(VR 스캐닝) | 부산교통공사와 부산영상위원회가 촬영장소 비대면 답사 지원을 위해 협업하여 제작한 부산진역 측선 특수촬영본입니다. <br/>해당 촬영본은 VR스캐너를 통해 부산진역 측선을 360도 스캐닝하였으며, 링크 접속 시 3D로 촬영본을 보실 수 있습니다. | 126 | 교통및물류 - 철도 | B551542 | 부산교통공사 | N | N | 2023-08-29 | 2023-09-05 | https://www.data.go.kr/data/15121037/fileData.do | 29 | 도시철도,VR,촬영 |
18118 | 15123305 | FILE | 경기도_도로대장 전산화 시스템_생태통로 | 경기도_도로대장 전산화 시스템_생태통로 테이블의 정보입니다.<br/><br/>생태통로 위치, 유형, 규모 등에 대한 정보를 제공합니다. | 183 | 교통및물류 - 도로 | 6410000 | 경기도 | N | N | 2023-09-18 | 2023-09-18 | https://www.data.go.kr/data/15123305/fileData.do | 7 | 야생동물,고속도로,동물안전 |
26382 | 15042200 | FILE | 한국동서발전(주)_중소기업제품 구매 현황 | 한국동서발전의 중소기업 제품 구매 현황 정보입니다. 중소기업 제품 구매 현황은 년도, 분기, 구분, 종류, 구매액의 항목으로 구성됩니다. | 2122 | 산업·통상·중소기업 - 산업·중소기업일반 | B552070 | 한국동서발전(주) | N | N | 2019-12-27 | 2023-08-17 | https://www.data.go.kr/data/15042200/fileData.do | 753 | 중소기업,중소기업제품,구매현황 |
24828 | 15083349 | FILE | 한국서부발전(주)_발전소배출수질 | 한국서부발전 발전소 배출 수질 정보입니다. 제공데이터는 연도,사업소,방류량(톤),pH,COD기준(㎎/ℓ),COD평균(㎎/ℓ),SS기준(㎎/ℓ),SS평균(㎎/ℓ),광유 기준(㎎/ℓ),광유 평균(㎎/ℓ),T-N기준(㎎/ℓ),T-N평균(㎎/ℓ),T-P기준(㎎/ℓ),T-P평균(㎎/ℓ)입니다.<br/>- pH : 수소이온농도<br/>- COD: 화학적산소요구량<br/>- SS: 부유물질량<br/>- T-N : 총질소<br/>- T-P : 총인 | 3221 | 산업·통상·중소기업 - 에너지및자원개발 | B552522 | 한국서부발전(주) | N | N | 2016-08-03 | 2023-08-23 | https://www.data.go.kr/data/15083349/fileData.do | 543 | 배출,수질,환경 |
13176 | 15041487 | FILE | 국가철도공단_경의중앙선_역위치 | 경의중앙선에서 운영하는 도시광역철도역들의 역위치에 관한 파일데이터로 철도운영기관명, 선명, 역명, 경도, 위도 의 항목이 있습니다. | 3423 | 교통및물류 - 철도 | B554334 | 국가철도공단 | Y | N | 2019-12-02 | 2023-11-03 | https://www.data.go.kr/data/15041487/fileData.do | 1259 | 도시광역철도,역위치,수도권 지하철 |
1929 | 15053529 | FILE | 대구광역시교육청 대구광역시군위교육지원청_학원현황 | 대구광역시교육청 대구광역시군위교육지원청 학원 현황에 대한 데이터로 학원명, 학원 주소. 학원 전화번호 등에 대한 정보를 포함합니다. | 2791 | 교육 - 유아및초·중등교육 | 8862000 | 대구광역시교육청 대구광역시군위교육지원청 | N | N | 2019-06-17 | 2024-03-14 | https://www.data.go.kr/data/15053529/fileData.do | 665 | 교육,초중등,학원 |
3192 | 15090113 | FILE | 여수광양항만공사_광양항 지역별 차량출입대수 정보 | 광양항 컨테이너부두 구역 월간 지역별 출입차량수 데이터입니다. 데이터는 자동차번호판 지역, 대수, 순위로 구성되어 있습니다.<br/>데이터는 매월 갱신됩니다.<br/> | 1583 | 교통및물류 - 해운·항만 | B552782 | 여수광양항만공사 | N | N | 2021-09-27 | 2024-02-29 | https://www.data.go.kr/data/15090113/fileData.do | 2317 | 광양항,월별,출입차량수 |