Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 10000 |
Missing cells | 3 |
Missing cells (%) | < 0.1% |
Duplicate rows | 692 |
Duplicate rows (%) | 6.9% |
Total size in memory | 634.8 KiB |
Average record size in memory | 65.0 B |
Variable types
Numeric | 1 |
---|---|
Text | 1 |
Categorical | 4 |
DateTime | 1 |
Dataset
Description | 강남구 스마트도서관 DB(구입년도, 서명, 도서타입, 이용제한구분, 관리구분, 선반위치부호의 단행서지색인정보를 제공합니다) |
---|---|
Author | 서울특별시 강남구 |
URL | https://www.data.go.kr/data/15071665/fileData.do |
도서타입 has constant value "" | Constant |
데이터기준일 has constant value "" | Constant |
Dataset has 692 (6.9%) duplicate rows | Duplicates |
선반위치부호 is highly overall correlated with 구입년도 and 1 other fields | High correlation |
관리구분 is highly overall correlated with 구입년도 and 1 other fields | High correlation |
구입년도 is highly overall correlated with 관리구분 and 1 other fields | High correlation |
이용제한구분 is highly imbalanced (91.8%) | Imbalance |
관리구분 is highly imbalanced (73.6%) | Imbalance |
선반위치부호 is highly imbalanced (54.7%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 06:37:49.876106 |
---|---|
Analysis finished | 2023-12-12 06:37:50.766466 |
Duration | 0.89 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
구입년도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 13 |
---|---|
Distinct (%) | 0.1% |
Missing | 3 |
Missing (%) | < 0.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2016.181 |
Minimum | 2006 |
---|---|
Maximum | 2020 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2006 |
---|---|
5-th percentile | 2011 |
Q1 | 2014 |
median | 2016 |
Q3 | 2018 |
95-th percentile | 2020 |
Maximum | 2020 |
Range | 14 |
Interquartile range (IQR) | 4 |
Descriptive statistics
Standard deviation | 2.7127678 |
---|---|
Coefficient of variation (CV) | 0.0013454982 |
Kurtosis | -0.5635247 |
Mean | 2016.181 |
Median Absolute Deviation (MAD) | 2 |
Skewness | -0.42757587 |
Sum | 20155761 |
Variance | 7.359109 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2018 | 1241 | |
2019 | 1237 | |
2017 | 1214 | |
2020 | 1198 | |
2016 | 1155 | |
2015 | 1151 | |
2014 | 1119 | |
2013 | 753 | |
2011 | 298 | 3.0% |
2012 | 295 | 2.9% |
Other values (3) | 336 | 3.4% |
Value | Count | Frequency (%) |
2006 | 1 | < 0.1% |
2009 | 52 | 0.5% |
2010 | 283 | 2.8% |
2011 | 298 | 3.0% |
2012 | 295 | 2.9% |
2013 | 753 | |
2014 | 1119 | |
2015 | 1151 | |
2016 | 1155 | |
2017 | 1214 |
Value | Count | Frequency (%) |
2020 | 1198 | |
2019 | 1237 | |
2018 | 1241 | |
2017 | 1214 | |
2016 | 1155 | |
2015 | 1151 | |
2014 | 1119 | |
2013 | 753 | |
2012 | 295 | 2.9% |
2011 | 298 | 3.0% |
서명
Text
Distinct | 146 |
---|---|
Distinct (%) | 1.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
4307 | 16.9% | |
이코노미스트 | 964 | 3.8% |
marie | 621 | 2.4% |
maison | 621 | 2.4% |
claire | 621 | 2.4% |
씨네21 | 510 | 2.0% |
매경이코노미 | 373 | 1.5% |
시사in | 371 | 1.5% |
21 | 364 | 1.4% |
한겨레 | 364 | 1.4% |
Other values (279) | 16388 |
Most occurring characters
Value | Count | Frequency (%) |
16731 | 14.1% | |
= | 4495 | 3.8% |
e | 4382 | 3.7% |
a | 3176 | 2.7% |
i | 3015 | 2.5% |
이 | 2368 | 2.0% |
r | 2282 | 1.9% |
E | 2039 | 1.7% |
스 | 1923 | 1.6% |
o | 1906 | 1.6% |
Other values (303) | 76546 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 47857 | |
Lowercase Letter | 25695 | |
Uppercase Letter | 19984 | |
Space Separator | 16731 | 14.1% |
Math Symbol | 4511 | 3.8% |
Decimal Number | 1964 | 1.7% |
Close Punctuation | 650 | 0.5% |
Open Punctuation | 650 | 0.5% |
Other Punctuation | 448 | 0.4% |
Dash Punctuation | 373 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 2368 | 4.9% |
스 | 1923 | 4.0% |
코 | 1578 | 3.3% |
미 | 1453 | 3.0% |
노 | 1339 | 2.8% |
트 | 1234 | 2.6% |
간 | 1134 | 2.4% |
아 | 988 | 2.1% |
사 | 906 | 1.9% |
어 | 820 | 1.7% |
Other values (233) | 34114 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 4382 | |
a | 3176 | |
i | 3015 | |
r | 2282 | |
o | 1906 | 7.4% |
s | 1509 | 5.9% |
n | 1500 | 5.8% |
l | 1083 | 4.2% |
c | 976 | 3.8% |
w | 802 | 3.1% |
Other values (15) | 5064 |
Uppercase Letter
Value | Count | Frequency (%) |
E | 2039 | 10.2% |
N | 1706 | 8.5% |
I | 1700 | 8.5% |
M | 1612 | 8.1% |
T | 1440 | 7.2% |
R | 1366 | 6.8% |
O | 1291 | 6.5% |
L | 1111 | 5.6% |
A | 1027 | 5.1% |
H | 1009 | 5.0% |
Other values (14) | 5683 |
Decimal Number
Value | Count | Frequency (%) |
1 | 896 | |
2 | 878 | |
3 | 91 | 4.6% |
0 | 49 | 2.5% |
4 | 21 | 1.1% |
5 | 18 | 0.9% |
6 | 11 | 0.6% |
Other Punctuation
Value | Count | Frequency (%) |
& | 152 | |
: | 137 | |
, | 120 | |
. | 26 | 5.8% |
% | 13 | 2.9% |
Math Symbol
Value | Count | Frequency (%) |
= | 4495 | |
+ | 16 | 0.4% |
Close Punctuation
Value | Count | Frequency (%) |
) | 590 | |
] | 60 | 9.2% |
Open Punctuation
Value | Count | Frequency (%) |
( | 590 | |
[ | 60 | 9.2% |
Dash Punctuation
Value | Count | Frequency (%) |
― | 360 | |
- | 13 | 3.5% |
Space Separator
Value | Count | Frequency (%) |
16731 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 45679 | |
Hangul | 45073 | |
Common | 25327 | |
Katakana | 1440 | 1.2% |
Han | 1344 | 1.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 2368 | 5.3% |
스 | 1923 | 4.3% |
코 | 1578 | 3.5% |
미 | 1453 | 3.2% |
노 | 1339 | 3.0% |
트 | 1234 | 2.7% |
간 | 1134 | 2.5% |
아 | 988 | 2.2% |
사 | 906 | 2.0% |
어 | 820 | 1.8% |
Other values (223) | 31330 |
Latin
Value | Count | Frequency (%) |
e | 4382 | 9.6% |
a | 3176 | 7.0% |
i | 3015 | 6.6% |
r | 2282 | 5.0% |
E | 2039 | 4.5% |
o | 1906 | 4.2% |
N | 1706 | 3.7% |
I | 1700 | 3.7% |
M | 1612 | 3.5% |
s | 1509 | 3.3% |
Other values (39) | 22352 |
Common
Value | Count | Frequency (%) |
16731 | ||
= | 4495 | 17.7% |
1 | 896 | 3.5% |
2 | 878 | 3.5% |
) | 590 | 2.3% |
( | 590 | 2.3% |
― | 360 | 1.4% |
& | 152 | 0.6% |
: | 137 | 0.5% |
, | 120 | 0.5% |
Other values (11) | 378 | 1.5% |
Han
Value | Count | Frequency (%) |
語 | 360 | |
本 | 360 | |
日 | 360 | |
新 | 88 | 6.5% |
東 | 88 | 6.5% |
亞 | 88 | 6.5% |
Katakana
Value | Count | Frequency (%) |
ヤ | 360 | |
ル | 360 | |
ジ | 360 | |
ナ | 360 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 70646 | |
Hangul | 45073 | |
Katakana | 1440 | 1.2% |
CJK | 1344 | 1.1% |
Punctuation | 360 | 0.3% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
16731 | ||
= | 4495 | 6.4% |
e | 4382 | 6.2% |
a | 3176 | 4.5% |
i | 3015 | 4.3% |
r | 2282 | 3.2% |
E | 2039 | 2.9% |
o | 1906 | 2.7% |
N | 1706 | 2.4% |
I | 1700 | 2.4% |
Other values (59) | 29214 |
Hangul
Value | Count | Frequency (%) |
이 | 2368 | 5.3% |
스 | 1923 | 4.3% |
코 | 1578 | 3.5% |
미 | 1453 | 3.2% |
노 | 1339 | 3.0% |
트 | 1234 | 2.7% |
간 | 1134 | 2.5% |
아 | 988 | 2.2% |
사 | 906 | 2.0% |
어 | 820 | 1.8% |
Other values (223) | 31330 |
Katakana
Value | Count | Frequency (%) |
ヤ | 360 | |
ル | 360 | |
ジ | 360 | |
ナ | 360 |
CJK
Value | Count | Frequency (%) |
語 | 360 | |
本 | 360 | |
日 | 360 | |
新 | 88 | 6.5% |
東 | 88 | 6.5% |
亞 | 88 | 6.5% |
Punctuation
Value | Count | Frequency (%) |
― | 360 |
도서타입
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
도서 |
---|
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 도서 |
---|---|
2nd row | 도서 |
3rd row | 도서 |
4th row | 도서 |
5th row | 도서 |
Common Values
Value | Count | Frequency (%) |
도서 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
도서 | 10000 |
이용제한구분
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
적용안함 | |
---|---|
일반 | 102 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9796 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 적용안함 |
---|---|
2nd row | 적용안함 |
3rd row | 적용안함 |
4th row | 적용안함 |
5th row | 적용안함 |
Common Values
Value | Count | Frequency (%) |
적용안함 | 9898 | |
일반 | 102 | 1.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
적용안함 | 9898 | |
일반 | 102 | 1.0% |
관리구분
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
도곡정보문화도서관 | |
---|---|
삼성도서관 | |
세곡마루도서관 | 88 |
정다운도서관 | 2 |
Length
Max length | 9 |
---|---|
Median length | 9 |
Mean length | 8.6014 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 도곡정보문화도서관 |
---|---|
2nd row | 도곡정보문화도서관 |
3rd row | 도곡정보문화도서관 |
4th row | 도곡정보문화도서관 |
5th row | 도곡정보문화도서관 |
Common Values
Value | Count | Frequency (%) |
도곡정보문화도서관 | 8959 | |
삼성도서관 | 951 | 9.5% |
세곡마루도서관 | 88 | 0.9% |
정다운도서관 | 2 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
도곡정보문화도서관 | 8959 | |
삼성도서관 | 951 | 9.5% |
세곡마루도서관 | 88 | 0.9% |
정다운도서관 | 2 | < 0.1% |
선반위치부호
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
[도곡정보] 종합자료실 | |
---|---|
[도곡정보] 어린이자료실 | |
[삼성] 어린이서가 | 650 |
적용안함 | 406 |
[세곡마루]자료실 | 88 |
Length
Max length | 13 |
---|---|
Median length | 12 |
Mean length | 11.6392 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | [도곡정보] 종합자료실 |
---|---|
2nd row | [도곡정보] 종합자료실 |
3rd row | [도곡정보] 어린이자료실 |
4th row | [도곡정보] 종합자료실 |
5th row | [도곡정보] 종합자료실 |
Common Values
Value | Count | Frequency (%) |
[도곡정보] 종합자료실 | 7646 | |
[도곡정보] 어린이자료실 | 1208 | 12.1% |
[삼성] 어린이서가 | 650 | 6.5% |
적용안함 | 406 | 4.1% |
[세곡마루]자료실 | 88 | 0.9% |
[정다운] 어린이실 | 2 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
도곡정보 | 8854 | |
종합자료실 | 7646 | |
어린이자료실 | 1208 | 6.2% |
삼성 | 650 | 3.3% |
어린이서가 | 650 | 3.3% |
적용안함 | 406 | 2.1% |
세곡마루]자료실 | 88 | 0.5% |
정다운 | 2 | < 0.1% |
어린이실 | 2 | < 0.1% |
데이터기준일
Date
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2022-03-25 00:00:00 |
---|---|
Maximum | 2022-03-25 00:00:00 |
구입년도 | 이용제한구분 | 관리구분 | 선반위치부호 | |
---|---|---|---|---|
구입년도 | 1.000 | 0.235 | 0.726 | 0.597 |
이용제한구분 | 0.235 | 1.000 | 0.045 | 0.115 |
관리구분 | 0.726 | 0.045 | 1.000 | 0.999 |
선반위치부호 | 0.597 | 0.115 | 0.999 | 1.000 |
선반위치부호 | 관리구분 | 이용제한구분 | |
---|---|---|---|
선반위치부호 | 1.000 | 0.985 | 0.083 |
관리구분 | 0.985 | 1.000 | 0.030 |
이용제한구분 | 0.083 | 0.030 | 1.000 |
구입년도 | 이용제한구분 | 관리구분 | 선반위치부호 | |
---|---|---|---|---|
구입년도 | 1.000 | 0.176 | 0.767 | 0.585 |
이용제한구분 | 0.176 | 1.000 | 0.030 | 0.083 |
관리구분 | 0.767 | 0.030 | 1.000 | 0.985 |
선반위치부호 | 0.585 | 0.083 | 0.985 | 1.000 |
구입년도 | 서명 | 도서타입 | 이용제한구분 | 관리구분 | 선반위치부호 | 데이터기준일 | |
---|---|---|---|---|---|---|---|
4238 | 2013 | 고래가 그랬어 | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 종합자료실 | 2022-03-25 |
4647 | 2015 | (월간)TEPS | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 종합자료실 | 2022-03-25 |
4515 | 2019 | 위즈키즈 | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 어린이자료실 | 2022-03-25 |
3147 | 2020 | Newton = 뉴턴 | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 종합자료실 | 2022-03-25 |
3065 | 2014 | 씨네21 | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 종합자료실 | 2022-03-25 |
10438 | 2020 | 월간중앙 | 도서 | 적용안함 | 세곡마루도서관 | [세곡마루]자료실 | 2022-03-25 |
1313 | 2016 | (월간)헬스조선 | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 종합자료실 | 2022-03-25 |
9938 | 2017 | 기획회의 | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 종합자료실 | 2022-03-25 |
8399 | 2016 | 책 :책과 문화, 예술을 담은 잡지 = Chaeg = Chaeg = Chaeg = Chaeg | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 종합자료실 | 2022-03-25 |
10378 | 2020 | 이코노미스트 | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 종합자료실 | 2022-03-25 |
구입년도 | 서명 | 도서타입 | 이용제한구분 | 관리구분 | 선반위치부호 | 데이터기준일 | |
---|---|---|---|---|---|---|---|
2566 | 2020 | 사람과 산 | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 종합자료실 | 2022-03-25 |
5256 | 2014 | 이코노미스트 | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 종합자료실 | 2022-03-25 |
333 | 2014 | 어린이과학동아 | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 어린이자료실 | 2022-03-25 |
3295 | 2015 | 씨네21 | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 종합자료실 | 2022-03-25 |
8050 | 2015 | (중학)독서평설 = 독서 | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 종합자료실 | 2022-03-25 |
4792 | 2016 | 전원주택라이프 | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 종합자료실 | 2022-03-25 |
10056 | 2020 | Around = 어라운드 | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 종합자료실 | 2022-03-25 |
1248 | 2016 | TIME = 타임 | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 종합자료실 | 2022-03-25 |
2678 | 2020 | 월간미술 | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 종합자료실 | 2022-03-25 |
5245 | 2014 | 이코노미스트 | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 종합자료실 | 2022-03-25 |
Most frequently occurring
구입년도 | 서명 | 도서타입 | 이용제한구분 | 관리구분 | 선반위치부호 | 데이터기준일 | # duplicates | |
---|---|---|---|---|---|---|---|---|
28 | 2012 | 이코노미스트 | 도서 | 적용안함 | 삼성도서관 | 적용안함 | 2022-03-25 | 100 |
20 | 2011 | 이코노미스트 | 도서 | 적용안함 | 삼성도서관 | 적용안함 | 2022-03-25 | 96 |
19 | 2011 | 이코노미스트 | 도서 | 적용안함 | 삼성도서관 | [삼성] 어린이서가 | 2022-03-25 | 95 |
27 | 2012 | 이코노미스트 | 도서 | 적용안함 | 삼성도서관 | [삼성] 어린이서가 | 2022-03-25 | 95 |
11 | 2010 | 이코노미스트 | 도서 | 적용안함 | 삼성도서관 | [삼성] 어린이서가 | 2022-03-25 | 90 |
12 | 2010 | 이코노미스트 | 도서 | 적용안함 | 삼성도서관 | 적용안함 | 2022-03-25 | 83 |
277 | 2016 | 매경이코노미 | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 종합자료실 | 2022-03-25 | 51 |
284 | 2016 | 시사IN | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 종합자료실 | 2022-03-25 | 51 |
537 | 2019 | 시사IN | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 종합자료실 | 2022-03-25 | 51 |
112 | 2014 | THE JUNIOR HERALD | 도서 | 적용안함 | 도곡정보문화도서관 | [도곡정보] 어린이자료실 | 2022-03-25 | 50 |