Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 1211 |
Missing cells | 4 |
Missing cells (%) | 0.1% |
Duplicate rows | 3 |
Duplicate rows (%) | 0.2% |
Total size in memory | 56.9 KiB |
Average record size in memory | 48.1 B |
Variable types
Unsupported | 3 |
---|---|
Categorical | 2 |
Text | 1 |
Dataset
Description | 파일 다운로드 |
---|---|
Author | 서울특별시 |
URL | https://data.seoul.go.kr/dataList/OA-15462/S/1/datasetView.do |
Dataset has 3 (0.2%) duplicate rows | Duplicates |
Unnamed: 1 is highly overall correlated with Unnamed: 4 | High correlation |
Unnamed: 4 is highly overall correlated with Unnamed: 1 | High correlation |
서울특별시 간행물 판매 정보(20.04.) is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Unnamed: 3 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Unnamed: 5 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2024-05-04 06:23:19.998662 |
---|---|
Analysis finished | 2024-05-04 06:23:22.221721 |
Duration | 2.22 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
서울특별시 간행물 판매 정보(20.04.)
Unsupported
REJECTED
  UNSUPPORTED
 
Missing | 1 |
---|---|
Missing (%) | 0.1% |
Memory size | 9.6 KiB |
Unnamed: 1
Categorical
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.6 KiB |
역사/사료 | |
---|---|
연구/논문 | |
일반행정 | |
문화/관광 | |
통계 | 26 |
Other values (2) | 2 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.748142 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.2% |
Sample
1st row | <NA> |
---|---|
2nd row | 분류 |
3rd row | 일반행정 |
4th row | 역사/사료 |
5th row | 일반행정 |
Common Values
Value | Count | Frequency (%) |
역사/사료 | 477 | |
연구/논문 | 283 | |
일반행정 | 223 | |
문화/관광 | 200 | |
통계 | 26 | 2.1% |
<NA> | 1 | 0.1% |
분류 | 1 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
역사/사료 | 477 | |
연구/논문 | 283 | |
일반행정 | 223 | |
문화/관광 | 200 | |
통계 | 26 | 2.1% |
na | 1 | 0.1% |
분류 | 1 | 0.1% |
Unnamed: 2
Text
Distinct | 1204 |
---|---|
Distinct (%) | 99.5% |
Missing | 1 |
Missing (%) | 0.1% |
Memory size | 9.6 KiB |
Length
Max length | 76 |
---|---|
Median length | 41 |
Mean length | 17.828099 |
Min length | 3 |
Characters and Unicode
Total characters | 21572 |
---|---|
Distinct characters | 702 |
Distinct categories | 16 ? |
Distinct scripts | 4 ? |
Distinct blocks | 10 ? |
Unique
Unique | 1198 ? |
---|---|
Unique (%) | 99.0% |
Sample
1st row | 상품명 |
---|---|
2nd row | 2020 서울특별시 도시계획위원회 매뉴얼 |
3rd row | 식민도시 경성, 차별에서 파괴까지(서울역사강좌09) |
4th row | 2020 알기쉬운 지방세 |
5th row | 함께 읽는 도시재생(8권세트) |
Value | Count | Frequency (%) |
서울시 | 112 | 2.8% |
연구 | 86 | 2.2% |
서울의 | 80 | 2.0% |
서울 | 64 | 1.6% |
한성부자료집(漢城府資料集 | 46 | 1.2% |
42 | 1.1% | |
향토서울 | 36 | 0.9% |
위한 | 31 | 0.8% |
서울학연구 | 30 | 0.8% |
및 | 29 | 0.7% |
Other values (2463) | 3400 |
Most occurring characters
Value | Count | Frequency (%) |
2746 | 12.7% | |
서 | 995 | 4.6% |
울 | 795 | 3.7% |
( | 392 | 1.8% |
) | 392 | 1.8% |
시 | 389 | 1.8% |
사 | 360 | 1.7% |
2 | 357 | 1.7% |
0 | 332 | 1.5% |
1 | 323 | 1.5% |
Other values (692) | 14491 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 15085 | |
Space Separator | 2746 | 12.7% |
Decimal Number | 1720 | 8.0% |
Lowercase Letter | 529 | 2.5% |
Open Punctuation | 393 | 1.8% |
Close Punctuation | 393 | 1.8% |
Uppercase Letter | 320 | 1.5% |
Other Punctuation | 239 | 1.1% |
Dash Punctuation | 101 | 0.5% |
Letter Number | 18 | 0.1% |
Other values (6) | 28 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
서 | 995 | 6.6% |
울 | 795 | 5.3% |
시 | 389 | 2.6% |
사 | 360 | 2.4% |
구 | 297 | 2.0% |
의 | 297 | 2.0% |
제 | 271 | 1.8% |
연 | 264 | 1.8% |
한 | 221 | 1.5% |
기 | 216 | 1.4% |
Other values (598) | 10980 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 78 | |
o | 63 | |
l | 50 | |
i | 37 | 7.0% |
n | 36 | 6.8% |
u | 34 | 6.4% |
a | 33 | 6.2% |
t | 31 | 5.9% |
s | 28 | 5.3% |
r | 27 | 5.1% |
Other values (13) | 112 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 61 | |
G | 27 | 8.4% |
E | 21 | 6.6% |
D | 20 | 6.2% |
U | 19 | 5.9% |
P | 18 | 5.6% |
R | 17 | 5.3% |
N | 16 | 5.0% |
O | 16 | 5.0% |
I | 13 | 4.1% |
Other values (13) | 92 |
Other Punctuation
Value | Count | Frequency (%) |
: | 88 | |
, | 74 | |
. | 28 | 11.7% |
/ | 17 | 7.1% |
! | 10 | 4.2% |
· | 8 | 3.3% |
' | 5 | 2.1% |
? | 3 | 1.3% |
& | 3 | 1.3% |
; | 1 | 0.4% |
Other values (2) | 2 | 0.8% |
Decimal Number
Value | Count | Frequency (%) |
2 | 357 | |
0 | 332 | |
1 | 323 | |
3 | 117 | 6.8% |
5 | 110 | 6.4% |
4 | 108 | 6.3% |
6 | 107 | 6.2% |
9 | 102 | 5.9% |
7 | 91 | 5.3% |
8 | 73 | 4.2% |
Other Number
Value | Count | Frequency (%) |
⑥ | 1 | |
⑤ | 1 | |
④ | 1 | |
③ | 1 | |
② | 1 | |
① | 1 |
Letter Number
Value | Count | Frequency (%) |
Ⅰ | 10 | |
Ⅱ | 5 | |
Ⅹ | 1 | 5.6% |
Ⅴ | 1 | 5.6% |
Ⅳ | 1 | 5.6% |
Open Punctuation
Value | Count | Frequency (%) |
( | 392 | |
[ | 1 | 0.3% |
Close Punctuation
Value | Count | Frequency (%) |
) | 392 | |
] | 1 | 0.3% |
Math Symbol
Value | Count | Frequency (%) |
~ | 13 | |
+ | 1 | 7.1% |
Modifier Symbol
Value | Count | Frequency (%) |
˙ | 2 | |
` | 1 |
Initial Punctuation
Value | Count | Frequency (%) |
“ | 1 | |
‘ | 1 |
Final Punctuation
Value | Count | Frequency (%) |
” | 1 | |
’ | 1 |
Space Separator
Value | Count | Frequency (%) |
2746 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 101 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 14747 | |
Common | 5620 | 26.1% |
Latin | 867 | 4.0% |
Han | 338 | 1.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
서 | 995 | 6.7% |
울 | 795 | 5.4% |
시 | 389 | 2.6% |
사 | 360 | 2.4% |
구 | 297 | 2.0% |
의 | 297 | 2.0% |
제 | 271 | 1.8% |
연 | 264 | 1.8% |
한 | 221 | 1.5% |
기 | 216 | 1.5% |
Other values (556) | 10642 |
Latin
Value | Count | Frequency (%) |
e | 78 | 9.0% |
o | 63 | 7.3% |
S | 61 | 7.0% |
l | 50 | 5.8% |
i | 37 | 4.3% |
n | 36 | 4.2% |
u | 34 | 3.9% |
a | 33 | 3.8% |
t | 31 | 3.6% |
s | 28 | 3.2% |
Other values (41) | 416 |
Common
Value | Count | Frequency (%) |
2746 | ||
( | 392 | 7.0% |
) | 392 | 7.0% |
2 | 357 | 6.4% |
0 | 332 | 5.9% |
1 | 323 | 5.7% |
3 | 117 | 2.1% |
5 | 110 | 2.0% |
4 | 108 | 1.9% |
6 | 107 | 1.9% |
Other values (33) | 636 | 11.3% |
Han
Value | Count | Frequency (%) |
資 | 50 | |
料 | 50 | |
集 | 49 | |
漢 | 48 | |
城 | 48 | |
府 | 48 | |
大 | 4 | 1.2% |
小 | 3 | 0.9% |
市 | 2 | 0.6% |
年 | 2 | 0.6% |
Other values (32) | 34 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 14745 | |
ASCII | 6448 | |
CJK | 337 | 1.6% |
Number Forms | 18 | 0.1% |
None | 8 | < 0.1% |
Enclosed Alphanum | 6 | < 0.1% |
Punctuation | 5 | < 0.1% |
Modifier Letters | 2 | < 0.1% |
Compat Jamo | 2 | < 0.1% |
CJK Compat Ideographs | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2746 | ||
( | 392 | 6.1% |
) | 392 | 6.1% |
2 | 357 | 5.5% |
0 | 332 | 5.1% |
1 | 323 | 5.0% |
3 | 117 | 1.8% |
5 | 110 | 1.7% |
4 | 108 | 1.7% |
6 | 107 | 1.7% |
Other values (66) | 1464 |
Hangul
Value | Count | Frequency (%) |
서 | 995 | 6.7% |
울 | 795 | 5.4% |
시 | 389 | 2.6% |
사 | 360 | 2.4% |
구 | 297 | 2.0% |
의 | 297 | 2.0% |
제 | 271 | 1.8% |
연 | 264 | 1.8% |
한 | 221 | 1.5% |
기 | 216 | 1.5% |
Other values (555) | 10640 |
CJK
Value | Count | Frequency (%) |
資 | 50 | |
料 | 50 | |
集 | 49 | |
漢 | 48 | |
城 | 48 | |
府 | 48 | |
大 | 4 | 1.2% |
小 | 3 | 0.9% |
市 | 2 | 0.6% |
年 | 2 | 0.6% |
Other values (31) | 33 |
Number Forms
Value | Count | Frequency (%) |
Ⅰ | 10 | |
Ⅱ | 5 | |
Ⅹ | 1 | 5.6% |
Ⅴ | 1 | 5.6% |
Ⅳ | 1 | 5.6% |
None
Value | Count | Frequency (%) |
· | 8 |
Modifier Letters
Value | Count | Frequency (%) |
˙ | 2 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 2 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
六 | 1 |
Punctuation
Value | Count | Frequency (%) |
“ | 1 | |
” | 1 | |
‘ | 1 | |
’ | 1 | |
… | 1 |
Enclosed Alphanum
Value | Count | Frequency (%) |
⑥ | 1 | |
⑤ | 1 | |
④ | 1 | |
③ | 1 | |
② | 1 | |
① | 1 |
Unnamed: 3
Unsupported
REJECTED
  UNSUPPORTED
 
Missing | 1 |
---|---|
Missing (%) | 0.1% |
Memory size | 9.6 KiB |
Unnamed: 4
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.6 KiB |
<NA> | |
---|---|
품절 | |
임시품절 | 54 |
절판 | 52 |
품절여부 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.1940545 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | <NA> |
---|---|
2nd row | 품절여부 |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 668 | |
품절 | 436 | |
임시품절 | 54 | 4.5% |
절판 | 52 | 4.3% |
품절여부 | 1 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 668 | |
품절 | 436 | |
임시품절 | 54 | 4.5% |
절판 | 52 | 4.3% |
품절여부 | 1 | 0.1% |
Unnamed: 5
Unsupported
REJECTED
  UNSUPPORTED
 
Missing | 1 |
---|---|
Missing (%) | 0.1% |
Memory size | 9.6 KiB |
Unnamed: 1 | Unnamed: 4 | |
---|---|---|
Unnamed: 1 | 1.000 | 0.790 |
Unnamed: 4 | 0.790 | 1.000 |
Unnamed: 1 | Unnamed: 4 | |
---|---|---|
Unnamed: 1 | 1.000 | 0.634 |
Unnamed: 4 | 0.634 | 1.000 |
Unnamed: 1 | Unnamed: 4 | |
---|---|---|
Unnamed: 1 | 1.000 | 0.634 |
Unnamed: 4 | 0.634 | 1.000 |
서울특별시 간행물 판매 정보(20.04.) | Unnamed: 1 | Unnamed: 2 | Unnamed: 3 | Unnamed: 4 | Unnamed: 5 | |
---|---|---|---|---|---|---|
0 | NaN | <NA> | <NA> | NaN | <NA> | NaN |
1 | 상품번호 | 분류 | 상품명 | 판매가격 | 품절여부 | 등록일자 |
2 | 11496 | 일반행정 | 2020 서울특별시 도시계획위원회 매뉴얼 | 6000 | <NA> | 2020-03-11 00:00:00 |
3 | 11457 | 역사/사료 | 식민도시 경성, 차별에서 파괴까지(서울역사강좌09) | 10000 | <NA> | 2020-03-04 00:00:00 |
4 | 11376 | 일반행정 | 2020 알기쉬운 지방세 | 2000 | <NA> | 2020-02-24 00:00:00 |
5 | 11356 | 일반행정 | 함께 읽는 도시재생(8권세트) | 40000 | <NA> | 2020-02-19 00:00:00 |
6 | 11344 | 역사/사료 | 백제학 연구총서 쟁점백제사 15 무령왕릉 다시보기 | 10000 | <NA> | 2020-02-14 00:00:00 |
7 | 11342 | 일반행정 | 뚜벅뚜벅 찾동씨 | 4000 | <NA> | 2020-02-14 00:00:00 |
8 | 11336 | 역사/사료 | 서울기획연구6 한양의 삼군영 | 15000 | <NA> | 2020-02-14 00:00:00 |
9 | 11316 | 문화/관광 | 미술관에 놓인 배움의 식탁 : 예술가의 런치박스 레시피 | 20000 | <NA> | 2020-01-31 00:00:00 |
서울특별시 간행물 판매 정보(20.04.) | Unnamed: 1 | Unnamed: 2 | Unnamed: 3 | Unnamed: 4 | Unnamed: 5 | |
---|---|---|---|---|---|---|
1201 | 148 | 역사/사료 | 서울육백년사 5 | 15000 | 품절 | 2004-01-20 00:00:00 |
1202 | 147 | 연구/논문 | 서울학 연구서설 | 8000 | 품절 | 2004-01-20 00:00:00 |
1203 | 146 | 역사/사료 | 서울육백년사 4 | 15000 | 품절 | 2004-01-20 00:00:00 |
1204 | 145 | 역사/사료 | 서울근현대사기행 | 8000 | 품절 | 2004-01-20 00:00:00 |
1205 | 143 | 문화/관광 | 서울의 음식문화 | 8000 | <NA> | 2004-01-20 00:00:00 |
1206 | 142 | 일반행정 | 2002 FIFA 월드컵 한국/일본 서울특별시 리포트 1509일의 대장정 | 16000 | 품절 | 2004-01-20 00:00:00 |
1207 | 140 | 문화/관광 | 서울의 경과곡 | 6000 | 임시품절 | 2004-01-20 00:00:00 |
1208 | 133 | 문화/관광 | 한강홍보엽서 | 500 | 절판 | 2004-01-20 00:00:00 |
1209 | 130 | 역사/사료 | 사진으로보는서울2 - 일제 침략 아래서의 서울 | 20000 | <NA> | 2004-01-20 00:00:00 |
1210 | 129 | 역사/사료 | 사진으로보는서울1 - 개항 이후 서울의 근대화와 그 시련 | 20000 | <NA> | 2004-01-20 00:00:00 |
Most frequently occurring
Unnamed: 1 | Unnamed: 2 | Unnamed: 4 | # duplicates | |
---|---|---|---|---|
0 | 역사/사료 | 사진으로보는서울1 - 개항 이후 서울의 근대화와 그 시련 | <NA> | 2 |
1 | 연구/논문 | 도시설계 개론 | 품절 | 2 |
2 | 일반행정 | 청소년 노동권리 수첩 | <NA> | 2 |