Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 220 |
Missing cells | 2 |
Missing cells (%) | 0.2% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.5% |
Total size in memory | 8.7 KiB |
Average record size in memory | 40.6 B |
Variable types
Unsupported | 1 |
---|---|
Text | 1 |
Categorical | 3 |
Dataset
Description | 통계청에서 발간하고 통계도서관에서 소장중인 통계청 발간 간행물 목록으로 단행본 및 연속간행물 목록으로 구성되어 있음 |
---|---|
Author | 통계청 |
URL | https://www.data.go.kr/data/15126791/fileData.do |
Dataset has 1 (0.5%) duplicate rows | Duplicates |
Unnamed: 4 is highly overall correlated with Unnamed: 2 and 1 other fields | High correlation |
Unnamed: 3 is highly overall correlated with Unnamed: 2 and 1 other fields | High correlation |
Unnamed: 2 is highly overall correlated with Unnamed: 3 and 1 other fields | High correlation |
Unnamed: 2 is highly imbalanced (56.8%) | Imbalance |
Unnamed: 3 is highly imbalanced (57.9%) | Imbalance |
Unnamed: 4 is highly imbalanced (94.7%) | Imbalance |
통계청 발간 간행물 목록(단행본) is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2024-03-14 08:40:42.512461 |
---|---|
Analysis finished | 2024-03-14 08:40:43.769638 |
Duration | 1.26 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
통계청 발간 간행물 목록(단행본)
Unsupported
REJECTED
  UNSUPPORTED
 
Missing | 1 |
---|---|
Missing (%) | 0.5% |
Memory size | 1.8 KiB |
Unnamed: 1
Text
Distinct | 218 |
---|---|
Distinct (%) | 99.5% |
Missing | 1 |
Missing (%) | 0.5% |
Memory size | 1.8 KiB |
Length
Max length | 102 |
---|---|
Median length | 65 |
Mean length | 36.547945 |
Min length | 2 |
Characters and Unicode
Total characters | 8004 |
---|---|
Distinct characters | 309 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 217 ? |
---|---|
Unique (%) | 99.1% |
Sample
1st row | 서명 |
---|---|
2nd row | (2023년)『청년패널조사』정기통계품질진단 결과보고서 = 2023 Regular Assessment Report |
3rd row | (2023년)『엔지니어링서비스업경영분석』정기통계품질진단 결과보고서 = 2023 Regular Assessment Report |
4th row | (2023년)『사망원인통계』정기통계품질진단 결과보고서 = 2023 Regular Assessment Report |
5th row | (2023)지역통계실무 |
Value | Count | Frequency (%) |
2023 | 120 | 11.1% |
78 | 7.2% | |
결과보고서 | 69 | 6.4% |
report | 68 | 6.3% |
assessment | 67 | 6.2% |
regular | 67 | 6.2% |
및 | 21 | 1.9% |
이해 | 16 | 1.5% |
맞춤형 | 16 | 1.5% |
통계분석 | 14 | 1.3% |
Other values (330) | 544 |
Most occurring characters
Value | Count | Frequency (%) |
861 | 10.8% | |
2 | 577 | 7.2% |
s | 278 | 3.5% |
) | 277 | 3.5% |
( | 277 | 3.5% |
0 | 275 | 3.4% |
e | 275 | 3.4% |
3 | 271 | 3.4% |
계 | 180 | 2.2% |
통 | 177 | 2.2% |
Other values (299) | 4556 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 3529 | |
Lowercase Letter | 1416 | |
Decimal Number | 1166 | 14.6% |
Space Separator | 861 | 10.8% |
Close Punctuation | 348 | 4.3% |
Open Punctuation | 348 | 4.3% |
Uppercase Letter | 237 | 3.0% |
Math Symbol | 69 | 0.9% |
Other Punctuation | 29 | 0.4% |
Dash Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
계 | 180 | 5.1% |
통 | 177 | 5.0% |
기 | 148 | 4.2% |
년 | 115 | 3.3% |
사 | 104 | 2.9% |
서 | 98 | 2.8% |
고 | 97 | 2.7% |
보 | 96 | 2.7% |
정 | 87 | 2.5% |
조 | 81 | 2.3% |
Other values (250) | 2346 |
Lowercase Letter
Value | Count | Frequency (%) |
s | 278 | |
e | 275 | |
t | 143 | |
r | 136 | |
n | 75 | 5.3% |
o | 75 | 5.3% |
a | 73 | 5.2% |
u | 72 | 5.1% |
p | 70 | 4.9% |
l | 70 | 4.9% |
Other values (6) | 149 |
Uppercase Letter
Value | Count | Frequency (%) |
R | 141 | |
A | 72 | |
S | 11 | 4.6% |
C | 3 | 1.3% |
I | 2 | 0.8% |
N | 1 | 0.4% |
T | 1 | 0.4% |
B | 1 | 0.4% |
E | 1 | 0.4% |
H | 1 | 0.4% |
Other values (3) | 3 | 1.3% |
Decimal Number
Value | Count | Frequency (%) |
2 | 577 | |
0 | 275 | |
3 | 271 | |
1 | 28 | 2.4% |
4 | 6 | 0.5% |
9 | 4 | 0.3% |
6 | 3 | 0.3% |
7 | 1 | 0.1% |
5 | 1 | 0.1% |
Other Punctuation
Value | Count | Frequency (%) |
· | 18 | |
: | 7 | 24.1% |
& | 2 | 6.9% |
. | 2 | 6.9% |
Close Punctuation
Value | Count | Frequency (%) |
) | 277 | |
』 | 71 | 20.4% |
Open Punctuation
Value | Count | Frequency (%) |
( | 277 | |
『 | 71 | 20.4% |
Space Separator
Value | Count | Frequency (%) |
861 |
Math Symbol
Value | Count | Frequency (%) |
= | 69 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 3529 | |
Common | 2822 | |
Latin | 1653 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
계 | 180 | 5.1% |
통 | 177 | 5.0% |
기 | 148 | 4.2% |
년 | 115 | 3.3% |
사 | 104 | 2.9% |
서 | 98 | 2.8% |
고 | 97 | 2.7% |
보 | 96 | 2.7% |
정 | 87 | 2.5% |
조 | 81 | 2.3% |
Other values (250) | 2346 |
Latin
Value | Count | Frequency (%) |
s | 278 | |
e | 275 | |
t | 143 | |
R | 141 | |
r | 136 | |
n | 75 | 4.5% |
o | 75 | 4.5% |
a | 73 | 4.4% |
u | 72 | 4.4% |
A | 72 | 4.4% |
Other values (19) | 313 |
Common
Value | Count | Frequency (%) |
861 | ||
2 | 577 | |
) | 277 | 9.8% |
( | 277 | 9.8% |
0 | 275 | 9.7% |
3 | 271 | 9.6% |
『 | 71 | 2.5% |
』 | 71 | 2.5% |
= | 69 | 2.4% |
1 | 28 | 1.0% |
Other values (10) | 45 | 1.6% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 4315 | |
Hangul | 3529 | |
None | 160 | 2.0% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
861 | ||
2 | 577 | |
s | 278 | 6.4% |
) | 277 | 6.4% |
( | 277 | 6.4% |
0 | 275 | 6.4% |
e | 275 | 6.4% |
3 | 271 | 6.3% |
t | 143 | 3.3% |
R | 141 | 3.3% |
Other values (36) | 940 |
Hangul
Value | Count | Frequency (%) |
계 | 180 | 5.1% |
통 | 177 | 5.0% |
기 | 148 | 4.2% |
년 | 115 | 3.3% |
사 | 104 | 2.9% |
서 | 98 | 2.8% |
고 | 97 | 2.7% |
보 | 96 | 2.7% |
정 | 87 | 2.5% |
조 | 81 | 2.3% |
Other values (250) | 2346 |
None
Value | Count | Frequency (%) |
『 | 71 | |
』 | 71 | |
· | 18 | 11.2% |
Unnamed: 2
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 7 |
---|---|
Distinct (%) | 3.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.8 KiB |
통계청 . 통계교육원 | |
---|---|
통계청 | |
통계교육원 | 2 |
<NA> | 1 |
저자 | 1 |
Other values (2) | 2 |
Length
Max length | 14 |
---|---|
Median length | 11 |
Mean length | 7.2227273 |
Min length | 2 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 1.8% |
Sample
1st row | <NA> |
---|---|
2nd row | 저자 |
3rd row | 통계청 |
4th row | 통계청 |
5th row | 통계청 |
Common Values
Value | Count | Frequency (%) |
통계청 . 통계교육원 | 113 | |
통계청 | 101 | |
통계교육원 | 2 | 0.9% |
<NA> | 1 | 0.5% |
저자 | 1 | 0.5% |
통계청 . 경인지방통계청 | 1 | 0.5% |
통계청 . 강원지방통계지청 | 1 | 0.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
통계청 | 216 | |
115 | ||
통계교육원 | 115 | |
na | 1 | 0.2% |
저자 | 1 | 0.2% |
경인지방통계청 | 1 | 0.2% |
강원지방통계지청 | 1 | 0.2% |
Unnamed: 3
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 7 |
---|---|
Distinct (%) | 3.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.8 KiB |
통계교육원 | |
---|---|
통계청 | |
<NA> | 1 |
출판사 | 1 |
통계청 : 경인통계청 | 1 |
Other values (2) | 2 |
Length
Max length | 11 |
---|---|
Median length | 5 |
Mean length | 4.1363636 |
Min length | 3 |
Unique
Unique | 5 ? |
---|---|
Unique (%) | 2.3% |
Sample
1st row | <NA> |
---|---|
2nd row | 출판사 |
3rd row | 통계청 |
4th row | 통계청 |
5th row | 통계청 |
Common Values
Value | Count | Frequency (%) |
통계교육원 | 115 | |
통계청 | 100 | |
<NA> | 1 | 0.5% |
출판사 | 1 | 0.5% |
통계청 : 경인통계청 | 1 | 0.5% |
통계청 통계교육원 | 1 | 0.5% |
강원지방통계지청 | 1 | 0.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
통계교육원 | 116 | |
통계청 | 102 | |
na | 1 | 0.4% |
출판사 | 1 | 0.4% |
1 | 0.4% | |
경인통계청 | 1 | 0.4% |
강원지방통계지청 | 1 | 0.4% |
Unnamed: 4
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 1.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.8 KiB |
2023 | |
---|---|
<NA> | 1 |
출판년 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9954545 |
Min length | 3 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.9% |
Sample
1st row | <NA> |
---|---|
2nd row | 출판년 |
3rd row | 2023 |
4th row | 2023 |
5th row | 2023 |
Common Values
Value | Count | Frequency (%) |
2023 | 218 | |
<NA> | 1 | 0.5% |
출판년 | 1 | 0.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2023 | 218 | |
na | 1 | 0.5% |
출판년 | 1 | 0.5% |
Unnamed: 2 | Unnamed: 3 | Unnamed: 4 | |
---|---|---|---|
Unnamed: 2 | 1.000 | 0.995 | 1.000 |
Unnamed: 3 | 0.995 | 1.000 | 1.000 |
Unnamed: 4 | 1.000 | 1.000 | 1.000 |
Unnamed: 4 | Unnamed: 3 | Unnamed: 2 | |
---|---|---|---|
Unnamed: 4 | 1.000 | 0.991 | 0.991 |
Unnamed: 3 | 0.991 | 1.000 | 0.892 |
Unnamed: 2 | 0.991 | 0.892 | 1.000 |
Unnamed: 2 | Unnamed: 3 | Unnamed: 4 | |
---|---|---|---|
Unnamed: 2 | 1.000 | 0.892 | 0.991 |
Unnamed: 3 | 0.892 | 1.000 | 0.991 |
Unnamed: 4 | 0.991 | 0.991 | 1.000 |
통계청 발간 간행물 목록(단행본) | Unnamed: 1 | Unnamed: 2 | Unnamed: 3 | Unnamed: 4 | |
---|---|---|---|---|---|
0 | NaN | <NA> | <NA> | <NA> | <NA> |
1 | No. | 서명 | 저자 | 출판사 | 출판년 |
2 | 1 | (2023년)『청년패널조사』정기통계품질진단 결과보고서 = 2023 Regular Assessment Report | 통계청 | 통계청 | 2023 |
3 | 2 | (2023년)『엔지니어링서비스업경영분석』정기통계품질진단 결과보고서 = 2023 Regular Assessment Report | 통계청 | 통계청 | 2023 |
4 | 3 | (2023년)『사망원인통계』정기통계품질진단 결과보고서 = 2023 Regular Assessment Report | 통계청 | 통계청 | 2023 |
5 | 4 | (2023)지역통계실무 | 통계청 . 통계교육원 | 통계교육원 | 2023 |
6 | 5 | (2023)(제1기) 파이썬 중급 통계분석 | 통계청 . 통계교육원 | 통계교육원 | 2023 |
7 | 6 | (2023년)(제1기) 국가통계실무 3 | 통계청 . 통계교육원 | 통계교육원 | 2023 |
8 | 7 | (2023)(제1기) 재무제표 | 통계청 . 통계교육원 | 통계교육원 | 2023 |
9 | 8 | (2023년)『보육실태조사』정기통계품질진단 결과보고서 = 2023 Regular Assessment Report | 통계청 | 통계청 | 2023 |
통계청 발간 간행물 목록(단행본) | Unnamed: 1 | Unnamed: 2 | Unnamed: 3 | Unnamed: 4 | |
---|---|---|---|---|---|
210 | 209 | (2023)(제1기) R 중급 통계분석 | 통계청 . 통계교육원 | 통계교육원 | 2023 |
211 | 210 | (2023년) 고용통계의 이해 | 통계청 . 통계교육원 | 통계교육원 | 2023 |
212 | 211 | (2023) 통계를 활용한 통합사회 지도교사 연수 | 통계청 . 통계교육원 | 통계교육원 | 2023 |
213 | 212 | (2023) 실용통계 지도교사 통계교육 연수 | 통계청 . 통계교육원 | 통계교육원 | 2023 |
214 | 213 | (2023) 국민계정 | 통계청 . 통계교육원 | 통계교육원 | 2023 |
215 | 214 | (2023 지역통계 표준매뉴얼) 노인등록통계 | 통계청 | 통계청 | 2023 |
216 | 215 | (2023년)지역통계 우수사례집 | 통계청 | 통계청 | 2023 |
217 | 216 | (2023)(제1기)통계보고서 작성 | 통계청 . 통계교육원 | 통계교육원 | 2023 |
218 | 217 | (2023)(제2기)오피스를 활용한 데이터시각화(서울) | 통계청 . 통계교육원 | 통계교육원 | 2023 |
219 | 218 | (2023년)(제1기) 국가통계실무 4 | 통계청 . 통계교육원 | 통계교육원 | 2023 |
Most frequently occurring
Unnamed: 1 | Unnamed: 2 | Unnamed: 3 | Unnamed: 4 | # duplicates | |
---|---|---|---|---|---|
0 | (2023) 통계를 활용한 통합사회 지도교사 연수 | 통계청 . 통계교육원 | 통계교육원 | 2023 | 2 |