Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 515 |
Missing cells | 1362 |
Missing cells (%) | 44.1% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.2% |
Total size in memory | 25.3 KiB |
Average record size in memory | 50.3 B |
Variable types
Numeric | 1 |
---|---|
Text | 2 |
Categorical | 3 |
Dataset
Description | 부산광역시기장군_정관어린이도서관신착자료현황_20200731 |
---|---|
Author | 부산광역시 기장군 |
URL | http://data.busan.go.kr/dataSet/detail.nm?contentId=10&publicdatapk=15060476 |
Dataset has 1 (0.2%) duplicate rows | Duplicates |
자료실명 is highly overall correlated with 순번 and 2 other fields | High correlation |
발행년 is highly overall correlated with 발행자 and 1 other fields | High correlation |
발행자 is highly overall correlated with 발행년 and 1 other fields | High correlation |
순번 is highly overall correlated with 자료실명 | High correlation |
발행자 is highly imbalanced (78.2%) | Imbalance |
발행년 is highly imbalanced (74.9%) | Imbalance |
순번 has 454 (88.2%) missing values | Missing |
서명 has 454 (88.2%) missing values | Missing |
저작자 has 454 (88.2%) missing values | Missing |
Reproduction
Analysis started | 2023-12-10 16:24:56.586411 |
---|---|
Analysis finished | 2023-12-10 16:24:57.851643 |
Duration | 1.27 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순번
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 61 |
---|---|
Distinct (%) | 100.0% |
Missing | 454 |
Missing (%) | 88.2% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 31 |
Minimum | 1 |
---|---|
Maximum | 61 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.7 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 4 |
Q1 | 16 |
median | 31 |
Q3 | 46 |
95-th percentile | 58 |
Maximum | 61 |
Range | 60 |
Interquartile range (IQR) | 30 |
Descriptive statistics
Standard deviation | 17.752934 |
---|---|
Coefficient of variation (CV) | 0.57267529 |
Kurtosis | -1.2 |
Mean | 31 |
Median Absolute Deviation (MAD) | 15 |
Skewness | 0 |
Sum | 1891 |
Variance | 315.16667 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
47 | 1 | 0.2% |
34 | 1 | 0.2% |
35 | 1 | 0.2% |
36 | 1 | 0.2% |
37 | 1 | 0.2% |
38 | 1 | 0.2% |
39 | 1 | 0.2% |
40 | 1 | 0.2% |
41 | 1 | 0.2% |
42 | 1 | 0.2% |
Other values (51) | 51 | 9.9% |
(Missing) | 454 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
61 | 1 | |
60 | 1 | |
59 | 1 | |
58 | 1 | |
57 | 1 | |
56 | 1 | |
55 | 1 | |
54 | 1 | |
53 | 1 | |
52 | 1 |
서명
Text
MISSING
 
Distinct | 61 |
---|---|
Distinct (%) | 100.0% |
Missing | 454 |
Missing (%) | 88.2% |
Memory size | 4.2 KiB |
Length
Max length | 83 |
---|---|
Median length | 30 |
Mean length | 25.868852 |
Min length | 13 |
Characters and Unicode
Total characters | 1578 |
---|---|
Distinct characters | 244 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 61 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 아기는 어떻게 생기나요? [DVD 녹화자료] |
---|---|
2nd row | 아기 탄생의 비밀 [DVD 녹화자료] |
3rd row | 신종 바이러스 예방 대작전 [DVD 녹화자료] |
4th row | 코로나19 소독 대작전! [DVD 녹화자료] |
5th row | 코로나19 바이러스의 비밀 침투 [DVD 녹화자료] |
Value | Count | Frequency (%) |
dvd | 61 | 18.1% |
녹화자료 | 55 | 16.3% |
13 | 3.9% | |
tayo | 8 | 2.4% |
english | 8 | 2.4% |
2 | 5 | 1.5% |
비밀 | 5 | 1.5% |
season | 4 | 1.2% |
1 | 4 | 1.2% |
2-2-disk | 2 | 0.6% |
Other values (158) | 172 |
Most occurring characters
Value | Count | Frequency (%) |
276 | 17.5% | |
D | 122 | 7.7% |
V | 63 | 4.0% |
녹 | 61 | 3.9% |
화 | 61 | 3.9% |
] | 61 | 3.9% |
료 | 61 | 3.9% |
[ | 61 | 3.9% |
자 | 61 | 3.9% |
i | 26 | 1.6% |
Other values (234) | 725 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 673 | |
Space Separator | 276 | |
Uppercase Letter | 214 | 13.6% |
Lowercase Letter | 206 | 13.1% |
Close Punctuation | 64 | 4.1% |
Open Punctuation | 64 | 4.1% |
Decimal Number | 34 | 2.2% |
Other Punctuation | 29 | 1.8% |
Dash Punctuation | 12 | 0.8% |
Math Symbol | 6 | 0.4% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
녹 | 61 | 9.1% |
화 | 61 | 9.1% |
료 | 61 | 9.1% |
자 | 61 | 9.1% |
스 | 25 | 3.7% |
의 | 15 | 2.2% |
이 | 14 | 2.1% |
아 | 10 | 1.5% |
트 | 10 | 1.5% |
비 | 8 | 1.2% |
Other values (185) | 347 |
Lowercase Letter
Value | Count | Frequency (%) |
i | 26 | |
s | 23 | |
o | 21 | |
a | 20 | |
n | 20 | |
l | 13 | 6.3% |
e | 11 | 5.3% |
d | 11 | 5.3% |
h | 10 | 4.9% |
t | 10 | 4.9% |
Other values (12) | 41 |
Uppercase Letter
Value | Count | Frequency (%) |
D | 122 | |
V | 63 | |
E | 9 | 4.2% |
T | 8 | 3.7% |
S | 5 | 2.3% |
R | 2 | 0.9% |
K | 1 | 0.5% |
J | 1 | 0.5% |
B | 1 | 0.5% |
A | 1 | 0.5% |
Decimal Number
Value | Count | Frequency (%) |
2 | 15 | |
1 | 12 | |
3 | 3 | 8.8% |
9 | 3 | 8.8% |
0 | 1 | 2.9% |
Other Punctuation
Value | Count | Frequency (%) |
: | 14 | |
. | 13 | |
! | 1 | 3.4% |
? | 1 | 3.4% |
Close Punctuation
Value | Count | Frequency (%) |
] | 61 | |
) | 3 | 4.7% |
Open Punctuation
Value | Count | Frequency (%) |
[ | 61 | |
( | 3 | 4.7% |
Space Separator
Value | Count | Frequency (%) |
276 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 12 |
Math Symbol
Value | Count | Frequency (%) |
= | 6 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 673 | |
Common | 485 | |
Latin | 420 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
녹 | 61 | 9.1% |
화 | 61 | 9.1% |
료 | 61 | 9.1% |
자 | 61 | 9.1% |
스 | 25 | 3.7% |
의 | 15 | 2.2% |
이 | 14 | 2.1% |
아 | 10 | 1.5% |
트 | 10 | 1.5% |
비 | 8 | 1.2% |
Other values (185) | 347 |
Latin
Value | Count | Frequency (%) |
D | 122 | |
V | 63 | |
i | 26 | 6.2% |
s | 23 | 5.5% |
o | 21 | 5.0% |
a | 20 | 4.8% |
n | 20 | 4.8% |
l | 13 | 3.1% |
e | 11 | 2.6% |
d | 11 | 2.6% |
Other values (23) | 90 |
Common
Value | Count | Frequency (%) |
276 | ||
] | 61 | 12.6% |
[ | 61 | 12.6% |
2 | 15 | 3.1% |
: | 14 | 2.9% |
. | 13 | 2.7% |
- | 12 | 2.5% |
1 | 12 | 2.5% |
= | 6 | 1.2% |
) | 3 | 0.6% |
Other values (6) | 12 | 2.5% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 905 | |
Hangul | 673 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
276 | ||
D | 122 | |
V | 63 | 7.0% |
] | 61 | 6.7% |
[ | 61 | 6.7% |
i | 26 | 2.9% |
s | 23 | 2.5% |
o | 21 | 2.3% |
a | 20 | 2.2% |
n | 20 | 2.2% |
Other values (39) | 212 |
Hangul
Value | Count | Frequency (%) |
녹 | 61 | 9.1% |
화 | 61 | 9.1% |
료 | 61 | 9.1% |
자 | 61 | 9.1% |
스 | 25 | 3.7% |
의 | 15 | 2.2% |
이 | 14 | 2.1% |
아 | 10 | 1.5% |
트 | 10 | 1.5% |
비 | 8 | 1.2% |
Other values (185) | 347 |
저작자
Text
MISSING
 
Distinct | 53 |
---|---|
Distinct (%) | 86.9% |
Missing | 454 |
Missing (%) | 88.2% |
Memory size | 4.2 KiB |
Length
Max length | 27 |
---|---|
Median length | 23 |
Mean length | 13.655738 |
Min length | 6 |
Characters and Unicode
Total characters | 833 |
---|---|
Distinct characters | 180 |
Distinct categories | 6 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 49 ? |
---|---|
Unique (%) | 80.3% |
Sample
1st row | 하성현,우지연 [공]연출 ; EBS [기획·제작] |
---|---|
2nd row | 하성현 연출 ; EBS [기획·제작] |
3rd row | 하성현 연출 ; EBS 기획·제작 |
4th row | 하성현,우지연 [공]연출 ; EBS 기획·제작 |
5th row | 하성현,우지연 [공]연출 ; EBS 기획·제작 |
Value | Count | Frequency (%) |
감독 | 41 | |
16 | 7.4% | |
기획·제작 | 16 | 7.4% |
ebs | 15 | 7.0% |
공]감독 | 10 | 4.7% |
교육방송 | 8 | 3.7% |
연출 | 5 | 2.3% |
신창환 | 4 | 1.9% |
김민성 | 4 | 1.9% |
하성현,우지연 | 3 | 1.4% |
Other values (86) | 93 |
Most occurring characters
Value | Count | Frequency (%) |
154 | 18.5% | |
독 | 53 | 6.4% |
감 | 52 | 6.2% |
제 | 20 | 2.4% |
기 | 17 | 2.0% |
작 | 17 | 2.0% |
획 | 16 | 1.9% |
] | 16 | 1.9% |
· | 16 | 1.9% |
[ | 16 | 1.9% |
Other values (170) | 456 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 547 | |
Space Separator | 154 | 18.5% |
Uppercase Letter | 51 | 6.1% |
Other Punctuation | 49 | 5.9% |
Close Punctuation | 16 | 1.9% |
Open Punctuation | 16 | 1.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
독 | 53 | 9.7% |
감 | 52 | 9.5% |
제 | 20 | 3.7% |
기 | 17 | 3.1% |
작 | 17 | 3.1% |
획 | 16 | 2.9% |
이 | 16 | 2.9% |
스 | 14 | 2.6% |
공 | 13 | 2.4% |
연 | 12 | 2.2% |
Other values (157) | 317 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 16 | |
S | 15 | |
E | 15 | |
M | 2 | 3.9% |
J | 2 | 3.9% |
C | 1 | 2.0% |
Other Punctuation
Value | Count | Frequency (%) |
· | 16 | |
; | 16 | |
, | 14 | |
. | 3 | 6.1% |
Space Separator
Value | Count | Frequency (%) |
154 |
Close Punctuation
Value | Count | Frequency (%) |
] | 16 |
Open Punctuation
Value | Count | Frequency (%) |
[ | 16 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 547 | |
Common | 235 | |
Latin | 51 | 6.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
독 | 53 | 9.7% |
감 | 52 | 9.5% |
제 | 20 | 3.7% |
기 | 17 | 3.1% |
작 | 17 | 3.1% |
획 | 16 | 2.9% |
이 | 16 | 2.9% |
스 | 14 | 2.6% |
공 | 13 | 2.4% |
연 | 12 | 2.2% |
Other values (157) | 317 |
Common
Value | Count | Frequency (%) |
154 | ||
] | 16 | 6.8% |
· | 16 | 6.8% |
[ | 16 | 6.8% |
; | 16 | 6.8% |
, | 14 | 6.0% |
. | 3 | 1.3% |
Latin
Value | Count | Frequency (%) |
B | 16 | |
S | 15 | |
E | 15 | |
M | 2 | 3.9% |
J | 2 | 3.9% |
C | 1 | 2.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 547 | |
ASCII | 270 | |
None | 16 | 1.9% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
154 | ||
] | 16 | 5.9% |
[ | 16 | 5.9% |
B | 16 | 5.9% |
; | 16 | 5.9% |
S | 15 | 5.6% |
E | 15 | 5.6% |
, | 14 | 5.2% |
. | 3 | 1.1% |
M | 2 | 0.7% |
Other values (2) | 3 | 1.1% |
Hangul
Value | Count | Frequency (%) |
독 | 53 | 9.7% |
감 | 52 | 9.5% |
제 | 20 | 3.7% |
기 | 17 | 3.1% |
작 | 17 | 3.1% |
획 | 16 | 2.9% |
이 | 16 | 2.9% |
스 | 14 | 2.6% |
공 | 13 | 2.4% |
연 | 12 | 2.2% |
Other values (157) | 317 |
None
Value | Count | Frequency (%) |
· | 16 |
발행자
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 26 |
---|---|
Distinct (%) | 5.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.2 KiB |
<NA> | |
---|---|
아이코닉스 [제조] | 8 |
인조인간 [제작·판매] | 7 |
EBS 미디어 | 7 |
해리슨 앤 컴퍼니 [제조·판매] | 5 |
Other values (21) | 34 |
Length
Max length | 21 |
---|---|
Median length | 4 |
Mean length | 5.0737864 |
Min length | 4 |
Unique
Unique | 12 ? |
---|---|
Unique (%) | 2.3% |
Sample
1st row | EBS 미디어 |
---|---|
2nd row | EBS 미디어 |
3rd row | EBS 미디어 |
4th row | EBS 미디어 |
5th row | EBS 미디어 |
Common Values
Value | Count | Frequency (%) |
<NA> | 454 | |
아이코닉스 [제조] | 8 | 1.6% |
인조인간 [제작·판매] | 7 | 1.4% |
EBS 미디어 | 7 | 1.4% |
해리슨 앤 컴퍼니 [제조·판매] | 5 | 1.0% |
알스컴퍼니 [제작·판매] | 3 | 0.6% |
미디어포유 [제작·판매] | 3 | 0.6% |
이십세기 폭스 홈 엔터테인먼트 [공급] | 3 | 0.6% |
아이브엔터테인먼트 [제작] | 3 | 0.6% |
다온미디어 [제작·판매] | 2 | 0.4% |
Other values (16) | 20 | 3.9% |
Length
Value | Count | Frequency (%) |
na | 454 | |
제작·판매 | 25 | 4.1% |
제조 | 8 | 1.3% |
미디어 | 8 | 1.3% |
아이코닉스 | 8 | 1.3% |
인조인간 | 7 | 1.2% |
ebs | 7 | 1.2% |
제작 | 7 | 1.2% |
공급 | 6 | 1.0% |
해리슨 | 5 | 0.8% |
Other values (31) | 70 | 11.6% |
발행년
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 1.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.2 KiB |
<NA> | |
---|---|
2020 | |
2017 | 9 |
2018 | 2 |
2016 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.4% |
Sample
1st row | 2020 |
---|---|
2nd row | 2020 |
3rd row | 2020 |
4th row | 2020 |
5th row | 2020 |
Common Values
Value | Count | Frequency (%) |
<NA> | 454 | |
2020 | 48 | 9.3% |
2017 | 9 | 1.7% |
2018 | 2 | 0.4% |
2016 | 1 | 0.2% |
2011 | 1 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 454 | |
2020 | 48 | 9.3% |
2017 | 9 | 1.7% |
2018 | 2 | 0.4% |
2016 | 1 | 0.2% |
2011 | 1 | 0.2% |
자료실명
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.2 KiB |
<NA> | |
---|---|
[정관]정관어린이도서관 아동자료실 |
Length
Max length | 18 |
---|---|
Median length | 4 |
Mean length | 5.6582524 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | [정관]정관어린이도서관 아동자료실 |
---|---|
2nd row | [정관]정관어린이도서관 아동자료실 |
3rd row | [정관]정관어린이도서관 아동자료실 |
4th row | [정관]정관어린이도서관 아동자료실 |
5th row | [정관]정관어린이도서관 아동자료실 |
Common Values
Value | Count | Frequency (%) |
<NA> | 454 | |
[정관]정관어린이도서관 아동자료실 | 61 | 11.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 454 | |
정관]정관어린이도서관 | 61 | 10.6% |
아동자료실 | 61 | 10.6% |
순번 | 서명 | 저작자 | 발행자 | 발행년 | |
---|---|---|---|---|---|
순번 | 1.000 | 1.000 | 0.977 | 0.830 | 0.716 |
서명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
저작자 | 0.977 | 1.000 | 1.000 | 1.000 | 1.000 |
발행자 | 0.830 | 1.000 | 1.000 | 1.000 | 0.951 |
발행년 | 0.716 | 1.000 | 1.000 | 0.951 | 1.000 |
자료실명 | 발행년 | 발행자 | |
---|---|---|---|
자료실명 | 1.000 | 1.000 | 1.000 |
발행년 | 1.000 | 1.000 | 0.586 |
발행자 | 1.000 | 0.586 | 1.000 |
순번 | 발행자 | 발행년 | 자료실명 | |
---|---|---|---|---|
순번 | 1.000 | 0.410 | 0.340 | 1.000 |
발행자 | 0.410 | 1.000 | 0.586 | 1.000 |
발행년 | 0.340 | 0.586 | 1.000 | 1.000 |
자료실명 | 1.000 | 1.000 | 1.000 | 1.000 |
순번 | 서명 | 저작자 | 발행자 | 발행년 | 자료실명 | |
---|---|---|---|---|---|---|
0 | 1 | 아기는 어떻게 생기나요? [DVD 녹화자료] | 하성현,우지연 [공]연출 ; EBS [기획·제작] | EBS 미디어 | 2020 | [정관]정관어린이도서관 아동자료실 |
1 | 2 | 아기 탄생의 비밀 [DVD 녹화자료] | 하성현 연출 ; EBS [기획·제작] | EBS 미디어 | 2020 | [정관]정관어린이도서관 아동자료실 |
2 | 3 | 신종 바이러스 예방 대작전 [DVD 녹화자료] | 하성현 연출 ; EBS 기획·제작 | EBS 미디어 | 2020 | [정관]정관어린이도서관 아동자료실 |
3 | 4 | 코로나19 소독 대작전! [DVD 녹화자료] | 하성현,우지연 [공]연출 ; EBS 기획·제작 | EBS 미디어 | 2020 | [정관]정관어린이도서관 아동자료실 |
4 | 5 | 코로나19 바이러스의 비밀 침투 [DVD 녹화자료] | 하성현,우지연 [공]연출 ; EBS 기획·제작 | EBS 미디어 | 2020 | [정관]정관어린이도서관 아동자료실 |
5 | 6 | 가면 바이러스의 공격 [DVD 녹화자료] | 박유림 연출 ; EBS 기획·제작 | EBS 미디어 | 2020 | [정관]정관어린이도서관 아동자료실 |
6 | 7 | 공포의 빨간 도장 바이러스 [DVD 녹화자료] | 박유림 연출 ; EBS 기획·제작 | EBS 미디어 | 2020 | [정관]정관어린이도서관 아동자료실 |
7 | 8 | 너를 만났다 [DVD 녹화자료] : VR 휴먼다큐멘터리 | 김종우 연출 ; MBC 기획·제작 | 미디어포유 [판매] | 2020 | [정관]정관어린이도서관 아동자료실 |
8 | 9 | 고스트 버스터즈 [DVD 녹화자료] | 폴 페이그 감독 | 소니 픽쳐스 홈엔터테인먼트 [공급] | 2016 | [정관]정관어린이도서관 아동자료실 |
9 | 10 | Tayo English [DVD 녹화자료]. 1-disc 1 | 김민성 감독 ; EBS 교육방송 기획·제작 | 아이코닉스 [제조] | 2017 | [정관]정관어린이도서관 아동자료실 |
순번 | 서명 | 저작자 | 발행자 | 발행년 | 자료실명 | |
---|---|---|---|---|---|---|
505 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
506 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
507 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
508 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
509 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
510 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
511 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
512 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
513 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
514 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
순번 | 서명 | 저작자 | 발행자 | 발행년 | 자료실명 | # duplicates | |
---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 454 |