Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 2742 |
Missing cells | 1203 |
Missing cells (%) | 14.6% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 67.1 KiB |
Average record size in memory | 25.0 B |
Variable types
Numeric | 1 |
---|---|
Text | 2 |
Dataset
Description | 서울특별시 용산구 출판사 현황(연번, 출판사 사업체 명칭, 출판사 사업체 소재지 항목)에 대한 데이터를 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15090482/fileData.do |
Reproduction
Analysis started | 2023-12-12 14:48:59.107066 |
---|---|
Analysis finished | 2023-12-12 14:48:59.856281 |
Duration | 0.75 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
UNIQUE
 
Distinct | 2742 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1371.5 |
Minimum | 1 |
---|---|
Maximum | 2742 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 24.2 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 138.05 |
Q1 | 686.25 |
median | 1371.5 |
Q3 | 2056.75 |
95-th percentile | 2604.95 |
Maximum | 2742 |
Range | 2741 |
Interquartile range (IQR) | 1370.5 |
Descriptive statistics
Standard deviation | 791.69154 |
---|---|
Coefficient of variation (CV) | 0.57724502 |
Kurtosis | -1.2 |
Mean | 1371.5 |
Median Absolute Deviation (MAD) | 685.5 |
Skewness | 0 |
Sum | 3760653 |
Variance | 626775.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
1833 | 1 | < 0.1% |
1825 | 1 | < 0.1% |
1826 | 1 | < 0.1% |
1827 | 1 | < 0.1% |
1828 | 1 | < 0.1% |
1829 | 1 | < 0.1% |
1830 | 1 | < 0.1% |
1831 | 1 | < 0.1% |
1832 | 1 | < 0.1% |
Other values (2732) | 2732 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
2742 | 1 | |
2741 | 1 | |
2740 | 1 | |
2739 | 1 | |
2738 | 1 | |
2737 | 1 | |
2736 | 1 | |
2735 | 1 | |
2734 | 1 | |
2733 | 1 |
사업체명칭
Text
Distinct | 2675 |
---|---|
Distinct (%) | 97.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 21.6 KiB |
Value | Count | Frequency (%) |
도서출판 | 264 | 7.4% |
주식회사 | 121 | 3.4% |
books | 14 | 0.4% |
출판사 | 13 | 0.4% |
사단법인 | 11 | 0.3% |
press | 10 | 0.3% |
스튜디오 | 9 | 0.3% |
재단법인 | 7 | 0.2% |
미디어 | 6 | 0.2% |
5 | 0.1% | |
Other values (2933) | 3091 |
Most occurring characters
Value | Count | Frequency (%) |
809 | 4.1% | |
판 | 722 | 3.7% |
출 | 721 | 3.7% |
사 | 704 | 3.6% |
서 | 560 | 2.8% |
도 | 520 | 2.6% |
) | 476 | 2.4% |
( | 470 | 2.4% |
주 | 464 | 2.4% |
이 | 346 | 1.8% |
Other values (772) | 13904 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 15737 | |
Lowercase Letter | 1107 | 5.6% |
Uppercase Letter | 960 | 4.9% |
Space Separator | 809 | 4.1% |
Close Punctuation | 476 | 2.4% |
Open Punctuation | 470 | 2.4% |
Decimal Number | 65 | 0.3% |
Other Punctuation | 57 | 0.3% |
Dash Punctuation | 11 | 0.1% |
Math Symbol | 3 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
판 | 722 | 4.6% |
출 | 721 | 4.6% |
사 | 704 | 4.5% |
서 | 560 | 3.6% |
도 | 520 | 3.3% |
주 | 464 | 2.9% |
이 | 346 | 2.2% |
스 | 343 | 2.2% |
문 | 243 | 1.5% |
한 | 218 | 1.4% |
Other values (698) | 10896 |
Uppercase Letter
Value | Count | Frequency (%) |
E | 77 | 8.0% |
S | 74 | 7.7% |
O | 74 | 7.7% |
A | 70 | 7.3% |
I | 60 | 6.2% |
B | 55 | 5.7% |
N | 53 | 5.5% |
C | 49 | 5.1% |
T | 45 | 4.7% |
D | 45 | 4.7% |
Other values (16) | 358 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 137 | |
o | 117 | |
a | 95 | 8.6% |
n | 91 | 8.2% |
i | 90 | 8.1% |
s | 86 | 7.8% |
r | 78 | 7.0% |
t | 64 | 5.8% |
u | 40 | 3.6% |
l | 37 | 3.3% |
Other values (14) | 272 |
Decimal Number
Value | Count | Frequency (%) |
1 | 20 | |
2 | 19 | |
3 | 5 | 7.7% |
9 | 5 | 7.7% |
0 | 5 | 7.7% |
7 | 4 | 6.2% |
5 | 3 | 4.6% |
4 | 2 | 3.1% |
6 | 2 | 3.1% |
Other Punctuation
Value | Count | Frequency (%) |
. | 22 | |
& | 21 | |
, | 7 | 12.3% |
· | 3 | 5.3% |
" | 2 | 3.5% |
: | 1 | 1.8% |
& | 1 | 1.8% |
Math Symbol
Value | Count | Frequency (%) |
< | 1 | |
> | 1 | |
+ | 1 |
Space Separator
Value | Count | Frequency (%) |
809 |
Close Punctuation
Value | Count | Frequency (%) |
) | 476 |
Open Punctuation
Value | Count | Frequency (%) |
( | 470 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 11 |
Other Number
Value | Count | Frequency (%) |
₂ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 15714 | |
Latin | 2067 | 10.5% |
Common | 1892 | 9.6% |
Han | 23 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
판 | 722 | 4.6% |
출 | 721 | 4.6% |
사 | 704 | 4.5% |
서 | 560 | 3.6% |
도 | 520 | 3.3% |
주 | 464 | 3.0% |
이 | 346 | 2.2% |
스 | 343 | 2.2% |
문 | 243 | 1.5% |
한 | 218 | 1.4% |
Other values (676) | 10873 |
Latin
Value | Count | Frequency (%) |
e | 137 | 6.6% |
o | 117 | 5.7% |
a | 95 | 4.6% |
n | 91 | 4.4% |
i | 90 | 4.4% |
s | 86 | 4.2% |
r | 78 | 3.8% |
E | 77 | 3.7% |
S | 74 | 3.6% |
O | 74 | 3.6% |
Other values (40) | 1148 |
Common
Value | Count | Frequency (%) |
809 | ||
) | 476 | |
( | 470 | |
. | 22 | 1.2% |
& | 21 | 1.1% |
1 | 20 | 1.1% |
2 | 19 | 1.0% |
- | 11 | 0.6% |
, | 7 | 0.4% |
3 | 5 | 0.3% |
Other values (14) | 32 | 1.7% |
Han
Value | Count | Frequency (%) |
山 | 2 | 8.7% |
社 | 1 | 4.3% |
軒 | 1 | 4.3% |
字 | 1 | 4.3% |
版 | 1 | 4.3% |
出 | 1 | 4.3% |
感 | 1 | 4.3% |
院 | 1 | 4.3% |
謝 | 1 | 4.3% |
塵 | 1 | 4.3% |
Other values (12) | 12 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 15711 | |
ASCII | 3954 | 20.1% |
CJK | 23 | 0.1% |
None | 5 | < 0.1% |
Compat Jamo | 3 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
809 | ||
) | 476 | 12.0% |
( | 470 | 11.9% |
e | 137 | 3.5% |
o | 117 | 3.0% |
a | 95 | 2.4% |
n | 91 | 2.3% |
i | 90 | 2.3% |
s | 86 | 2.2% |
r | 78 | 2.0% |
Other values (61) | 1505 |
Hangul
Value | Count | Frequency (%) |
판 | 722 | 4.6% |
출 | 721 | 4.6% |
사 | 704 | 4.5% |
서 | 560 | 3.6% |
도 | 520 | 3.3% |
주 | 464 | 3.0% |
이 | 346 | 2.2% |
스 | 343 | 2.2% |
문 | 243 | 1.5% |
한 | 218 | 1.4% |
Other values (674) | 10870 |
None
Value | Count | Frequency (%) |
· | 3 | |
& | 1 | 20.0% |
₂ | 1 | 20.0% |
Compat Jamo
Value | Count | Frequency (%) |
ㅇ | 2 | |
ㅗ | 1 |
CJK
Value | Count | Frequency (%) |
山 | 2 | 8.7% |
社 | 1 | 4.3% |
軒 | 1 | 4.3% |
字 | 1 | 4.3% |
版 | 1 | 4.3% |
出 | 1 | 4.3% |
感 | 1 | 4.3% |
院 | 1 | 4.3% |
謝 | 1 | 4.3% |
塵 | 1 | 4.3% |
Other values (12) | 12 |
사업체소재지
Text
MISSING
 
Distinct | 1427 |
---|---|
Distinct (%) | 92.7% |
Missing | 1203 |
Missing (%) | 43.9% |
Memory size | 21.6 KiB |
Length
Max length | 56 |
---|---|
Median length | 45 |
Mean length | 34.667966 |
Min length | 22 |
Characters and Unicode
Total characters | 53354 |
---|---|
Distinct characters | 356 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 1341 ? |
---|---|
Unique (%) | 87.1% |
Sample
1st row | 서울특별시 용산구 한강대로62길 26 (한강로1가) |
---|---|
2nd row | 서울특별시 용산구 한강대로62나길 6 (한강로1가) |
3rd row | 서울특별시 용산구 만리재로 178 (서계동) |
4th row | 서울특별시 용산구 청파로73길 89 (서계동) |
5th row | 서울특별시 용산구 효창원로110길 4, 301호 (서계동, 덕성빌딩) |
Value | Count | Frequency (%) |
서울특별시 | 1539 | 15.4% |
용산구 | 1533 | 15.3% |
한남동 | 176 | 1.8% |
한강대로 | 174 | 1.7% |
한강로2가 | 137 | 1.4% |
2층 | 121 | 1.2% |
이태원동 | 108 | 1.1% |
한강로3가 | 104 | 1.0% |
이촌동 | 95 | 0.9% |
원효로1가 | 94 | 0.9% |
Other values (1669) | 5919 |
Most occurring characters
Value | Count | Frequency (%) |
8463 | 15.9% | |
1 | 2002 | 3.8% |
로 | 1996 | 3.7% |
서 | 1784 | 3.3% |
산 | 1764 | 3.3% |
용 | 1757 | 3.3% |
, | 1708 | 3.2% |
2 | 1585 | 3.0% |
시 | 1569 | 2.9% |
울 | 1561 | 2.9% |
Other values (346) | 29165 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 30175 | |
Decimal Number | 9398 | 17.6% |
Space Separator | 8463 | 15.9% |
Other Punctuation | 1709 | 3.2% |
Close Punctuation | 1544 | 2.9% |
Open Punctuation | 1544 | 2.9% |
Dash Punctuation | 367 | 0.7% |
Uppercase Letter | 129 | 0.2% |
Lowercase Letter | 24 | < 0.1% |
Math Symbol | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
로 | 1996 | 6.6% |
서 | 1784 | 5.9% |
산 | 1764 | 5.8% |
용 | 1757 | 5.8% |
시 | 1569 | 5.2% |
울 | 1561 | 5.2% |
구 | 1551 | 5.1% |
별 | 1542 | 5.1% |
특 | 1540 | 5.1% |
동 | 1443 | 4.8% |
Other values (299) | 13668 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 37 | |
A | 22 | |
D | 17 | |
C | 16 | |
T | 4 | 3.1% |
G | 4 | 3.1% |
H | 3 | 2.3% |
J | 3 | 2.3% |
S | 3 | 2.3% |
U | 2 | 1.6% |
Other values (11) | 18 |
Decimal Number
Value | Count | Frequency (%) |
1 | 2002 | |
2 | 1585 | |
0 | 1208 | |
3 | 1106 | |
4 | 832 | |
5 | 666 | 7.1% |
6 | 586 | 6.2% |
7 | 576 | 6.1% |
8 | 442 | 4.7% |
9 | 395 | 4.2% |
Lowercase Letter
Value | Count | Frequency (%) |
e | 8 | |
c | 6 | |
k | 3 | 12.5% |
l | 2 | 8.3% |
j | 1 | 4.2% |
i | 1 | 4.2% |
t | 1 | 4.2% |
r | 1 | 4.2% |
o | 1 | 4.2% |
Other Punctuation
Value | Count | Frequency (%) |
, | 1708 | |
& | 1 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
8463 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1544 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1544 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 367 |
Math Symbol
Value | Count | Frequency (%) |
~ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 30175 | |
Common | 23026 | |
Latin | 153 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
로 | 1996 | 6.6% |
서 | 1784 | 5.9% |
산 | 1764 | 5.8% |
용 | 1757 | 5.8% |
시 | 1569 | 5.2% |
울 | 1561 | 5.2% |
구 | 1551 | 5.1% |
별 | 1542 | 5.1% |
특 | 1540 | 5.1% |
동 | 1443 | 4.8% |
Other values (299) | 13668 |
Latin
Value | Count | Frequency (%) |
B | 37 | |
A | 22 | |
D | 17 | |
C | 16 | |
e | 8 | 5.2% |
c | 6 | 3.9% |
T | 4 | 2.6% |
G | 4 | 2.6% |
H | 3 | 2.0% |
J | 3 | 2.0% |
Other values (20) | 33 |
Common
Value | Count | Frequency (%) |
8463 | ||
1 | 2002 | 8.7% |
, | 1708 | 7.4% |
2 | 1585 | 6.9% |
) | 1544 | 6.7% |
( | 1544 | 6.7% |
0 | 1208 | 5.2% |
3 | 1106 | 4.8% |
4 | 832 | 3.6% |
5 | 666 | 2.9% |
Other values (7) | 2368 | 10.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 30175 | |
ASCII | 23179 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
8463 | ||
1 | 2002 | 8.6% |
, | 1708 | 7.4% |
2 | 1585 | 6.8% |
) | 1544 | 6.7% |
( | 1544 | 6.7% |
0 | 1208 | 5.2% |
3 | 1106 | 4.8% |
4 | 832 | 3.6% |
5 | 666 | 2.9% |
Other values (37) | 2521 | 10.9% |
Hangul
Value | Count | Frequency (%) |
로 | 1996 | 6.6% |
서 | 1784 | 5.9% |
산 | 1764 | 5.8% |
용 | 1757 | 5.8% |
시 | 1569 | 5.2% |
울 | 1561 | 5.2% |
구 | 1551 | 5.1% |
별 | 1542 | 5.1% |
특 | 1540 | 5.1% |
동 | 1443 | 4.8% |
Other values (299) | 13668 |
연번 | 사업체명칭 | 사업체소재지 | |
---|---|---|---|
0 | 1 | 극동출판사 | <NA> |
1 | 2 | 도서출판 한진 | <NA> |
2 | 3 | 도서출판(주)문진미디 | <NA> |
3 | 4 | 아동문학사 | <NA> |
4 | 5 | 기독교복음침례회 | 서울특별시 용산구 한강대로62길 26 (한강로1가) |
5 | 6 | (주)삼중당 | <NA> |
6 | 7 | 도서출판 탐구당 | 서울특별시 용산구 한강대로62나길 6 (한강로1가) |
7 | 8 | 장문사 | <NA> |
8 | 9 | 문호사 | <NA> |
9 | 10 | 문호사 | <NA> |
연번 | 사업체명칭 | 사업체소재지 | |
---|---|---|---|
2732 | 2733 | UE STUDIO(유이 스튜디오) | 서울특별시 용산구 새창로 120-5, 3층 304호 (용문동, 한강타운) |
2733 | 2734 | 재단법인 지구와사람 | 서울특별시 용산구 회나무로 66, 1층 (이태원동) |
2734 | 2735 | Bolognese Press | 서울특별시 용산구 대사관로11길 57 (한남동) |
2735 | 2736 | 크리에이아이터 | 서울특별시 용산구 소월로44길 2-2, 2층 (이태원동) |
2736 | 2737 | 오후의 테이블 | 서울특별시 용산구 청파로49길 37-3, 디테일씨빌딩 1층 (청파동2가) |
2737 | 2738 | 책공장 이안재 | 서울특별시 용산구 소월로 377, 402호 (한남동, 남산맨숀) |
2738 | 2739 | 영화사 이심전심 | 서울특별시 용산구 우사단로4길 26-3, 2층 (보광동) |
2739 | 2740 | 두다 | 서울특별시 용산구 후암로28길 70, 1층 (후암동) |
2740 | 2741 | 서혜영스튜디오 | 서울특별시 용산구 두텁바위로60길 49, 대원정사 304호 (후암동) |
2741 | 2742 | 주식회사 아키모스피어 | 서울특별시 용산구 한강대로72길 21-17 (남영동) |