Dataset statistics
Number of variables | 14 |
---|---|
Number of observations | 10000 |
Missing cells | 16736 |
Missing cells (%) | 12.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.2 MiB |
Average record size in memory | 126.0 B |
Variable types
Numeric | 5 |
---|---|
Categorical | 3 |
Text | 4 |
Unsupported | 1 |
DateTime | 1 |
Dataset
Description | 문화체육관광부에서 조사 및 취합한 전국에 위치한 출판사, 인쇄사 영업,폐업 정보, 지역정보 및 업체 주소 정보를 제공 |
---|---|
URL | https://www.data.go.kr/data/15060743/fileData.do |
순번 is highly overall correlated with 등록일 and 1 other fields | High correlation |
시군구코드 is highly overall correlated with 지역코드2 and 1 other fields | High correlation |
지역코드2 is highly overall correlated with 시군구코드 and 1 other fields | High correlation |
등록일 is highly overall correlated with 순번 and 1 other fields | High correlation |
폐업일 is highly overall correlated with 순번 and 1 other fields | High correlation |
시도명 is highly overall correlated with 시군구코드 and 1 other fields | High correlation |
영업구분 is highly imbalanced (50.4%) | Imbalance |
대표자 has 304 (3.0%) missing values | Missing |
개업일 has 10000 (100.0%) missing values | Missing |
폐업일 has 6372 (63.7%) missing values | Missing |
폐업일 is highly skewed (γ1 = 21.21892354) | Skewed |
순번 has unique values | Unique |
개업일 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2023-12-12 04:53:43.680681 |
---|---|
Analysis finished | 2023-12-12 04:53:50.561154 |
Duration | 6.88 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순번
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 39444.93 |
Minimum | 15 |
---|---|
Maximum | 78908 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 15 |
---|---|
5-th percentile | 3757.75 |
Q1 | 19476.5 |
median | 39596.5 |
Q3 | 58977 |
95-th percentile | 75245.7 |
Maximum | 78908 |
Range | 78893 |
Interquartile range (IQR) | 39500.5 |
Descriptive statistics
Standard deviation | 22874.967 |
---|---|
Coefficient of variation (CV) | 0.57992161 |
Kurtosis | -1.1954137 |
Mean | 39444.93 |
Median Absolute Deviation (MAD) | 19690 |
Skewness | -0.0056800273 |
Sum | 3.944493 × 108 |
Variance | 5.2326413 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
38943 | 1 | < 0.1% |
37406 | 1 | < 0.1% |
73146 | 1 | < 0.1% |
77765 | 1 | < 0.1% |
48904 | 1 | < 0.1% |
59192 | 1 | < 0.1% |
55149 | 1 | < 0.1% |
76401 | 1 | < 0.1% |
51245 | 1 | < 0.1% |
71783 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
15 | 1 | |
16 | 1 | |
29 | 1 | |
34 | 1 | |
50 | 1 | |
62 | 1 | |
63 | 1 | |
72 | 1 | |
74 | 1 | |
79 | 1 |
Value | Count | Frequency (%) |
78908 | 1 | |
78907 | 1 | |
78896 | 1 | |
78890 | 1 | |
78878 | 1 | |
78870 | 1 | |
78843 | 1 | |
78835 | 1 | |
78817 | 1 | |
78810 | 1 |
시군구코드
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 17 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 6192117 |
Minimum | 5690000 |
---|---|
Maximum | 6500000 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 5690000 |
---|---|
5-th percentile | 6110000 |
Q1 | 6110000 |
median | 6110000 |
Q3 | 6280000 |
95-th percentile | 6460000 |
Maximum | 6500000 |
Range | 810000 |
Interquartile range (IQR) | 170000 |
Descriptive statistics
Standard deviation | 142827.62 |
---|---|
Coefficient of variation (CV) | 0.02306604 |
Kurtosis | 0.34421488 |
Mean | 6192117 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 0.67454654 |
Sum | 6.192117 × 1010 |
Variance | 2.0399728 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
6110000 | 6870 | |
6410000 | 735 | 7.3% |
6280000 | 349 | 3.5% |
6450000 | 339 | 3.4% |
6440000 | 302 | 3.0% |
6300000 | 191 | 1.9% |
6460000 | 188 | 1.9% |
6500000 | 182 | 1.8% |
6260000 | 131 | 1.3% |
6310000 | 123 | 1.2% |
Other values (7) | 590 | 5.9% |
Value | Count | Frequency (%) |
5690000 | 80 | 0.8% |
6110000 | 6870 | |
6260000 | 131 | 1.3% |
6270000 | 103 | 1.0% |
6280000 | 349 | 3.5% |
6290000 | 74 | 0.7% |
6300000 | 191 | 1.9% |
6310000 | 123 | 1.2% |
6410000 | 735 | 7.3% |
6420000 | 62 | 0.6% |
Value | Count | Frequency (%) |
6500000 | 182 | 1.8% |
6480000 | 68 | 0.7% |
6470000 | 89 | 0.9% |
6460000 | 188 | 1.9% |
6450000 | 339 | |
6440000 | 302 | |
6430000 | 114 | 1.1% |
6420000 | 62 | 0.6% |
6410000 | 735 | |
6310000 | 123 | 1.2% |
시도명
Categorical
HIGH CORRELATION
 
Distinct | 18 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
서울특별시 | |
---|---|
경기도 | |
인천광역시 | 343 |
전라북도 | 343 |
충청남도 | 300 |
Other values (13) |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 4.7399 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울특별시 |
---|---|
2nd row | 서울특별시 |
3rd row | 서울특별시 |
4th row | 서울특별시 |
5th row | 서울특별시 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 6619 | |
경기도 | 934 | 9.3% |
인천광역시 | 343 | 3.4% |
전라북도 | 343 | 3.4% |
충청남도 | 300 | 3.0% |
대전광역시 | 191 | 1.9% |
제주특별자치도 | 189 | 1.9% |
전라남도 | 187 | 1.9% |
부산광역시 | 134 | 1.3% |
울산광역시 | 123 | 1.2% |
Other values (8) | 637 | 6.4% |
Length
Value | Count | Frequency (%) |
서울특별시 | 6619 | |
경기도 | 934 | 9.3% |
인천광역시 | 343 | 3.4% |
전라북도 | 343 | 3.4% |
충청남도 | 300 | 3.0% |
대전광역시 | 191 | 1.9% |
제주특별자치도 | 189 | 1.9% |
전라남도 | 187 | 1.9% |
부산광역시 | 134 | 1.3% |
울산광역시 | 123 | 1.2% |
Other values (8) | 637 | 6.4% |
지역코드2
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 206 |
---|---|
Distinct (%) | 2.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3492019.1 |
Minimum | 3000000 |
---|---|
Maximum | 6520000 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 3000000 |
---|---|
5-th percentile | 3000000 |
Q1 | 3020000 |
median | 3180000 |
Q3 | 3610000 |
95-th percentile | 5070000 |
Maximum | 6520000 |
Range | 3520000 |
Interquartile range (IQR) | 590000 |
Descriptive statistics
Standard deviation | 746081.83 |
---|---|
Coefficient of variation (CV) | 0.21365342 |
Kurtosis | 4.4594207 |
Mean | 3492019.1 |
Median Absolute Deviation (MAD) | 170000 |
Skewness | 2.1595171 |
Sum | 3.4920192 × 1010 |
Variance | 5.5663809 × 1011 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
3010000 | 1240 | 12.4% |
3210000 | 978 | 9.8% |
3000000 | 866 | 8.7% |
3180000 | 647 | 6.5% |
3020000 | 467 | 4.7% |
3230000 | 414 | 4.1% |
3120000 | 333 | 3.3% |
3030000 | 277 | 2.8% |
3110000 | 241 | 2.4% |
3070000 | 227 | 2.3% |
Other values (196) | 4310 |
Value | Count | Frequency (%) |
3000000 | 866 | |
3010000 | 1240 | |
3020000 | 467 | 4.7% |
3030000 | 277 | 2.8% |
3040000 | 45 | 0.4% |
3050000 | 30 | 0.3% |
3060000 | 103 | 1.0% |
3070000 | 227 | 2.3% |
3080000 | 24 | 0.2% |
3090000 | 23 | 0.2% |
Value | Count | Frequency (%) |
6520000 | 34 | 0.3% |
6510000 | 148 | |
5710000 | 33 | 0.3% |
5700000 | 3 | < 0.1% |
5690000 | 80 | |
5680000 | 16 | 0.2% |
5670000 | 22 | 0.2% |
5600000 | 1 | < 0.1% |
5590000 | 7 | 0.1% |
5580000 | 8 | 0.1% |
시군구명
Text
Distinct | 233 |
---|---|
Distinct (%) | 2.3% |
Missing | 30 |
Missing (%) | 0.3% |
Memory size | 156.2 KiB |
Length
Max length | 14 |
---|---|
Median length | 9 |
Mean length | 8.9950853 |
Min length | 7 |
Characters and Unicode
Total characters | 89681 |
---|---|
Distinct characters | 141 |
Distinct categories | 2 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 17 ? |
---|---|
Unique (%) | 0.2% |
Sample
1st row | 서울특별시 중구 |
---|---|
2nd row | 서울특별시 마포구 |
3rd row | 서울특별시 서초구 |
4th row | 서울특별시 종로구 |
5th row | 서울특별시 마포구 |
Value | Count | Frequency (%) |
서울특별시 | 6619 | |
중구 | 1228 | 5.9% |
경기도 | 934 | 4.5% |
서초구 | 871 | 4.2% |
종로구 | 734 | 3.6% |
영등포구 | 571 | 2.8% |
용산구 | 418 | 2.0% |
송파구 | 377 | 1.8% |
전라북도 | 343 | 1.7% |
인천광역시 | 343 | 1.7% |
Other values (225) | 8230 |
Most occurring characters
Value | Count | Frequency (%) |
10698 | 11.9% | |
시 | 9684 | 10.8% |
구 | 8553 | 9.5% |
서 | 8114 | 9.0% |
특 | 6890 | 7.7% |
별 | 6890 | 7.7% |
울 | 6756 | 7.5% |
도 | 2346 | 2.6% |
중 | 1326 | 1.5% |
남 | 1244 | 1.4% |
Other values (131) | 27180 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 78983 | |
Space Separator | 10698 | 11.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 9684 | 12.3% |
구 | 8553 | 10.8% |
서 | 8114 | 10.3% |
특 | 6890 | 8.7% |
별 | 6890 | 8.7% |
울 | 6756 | 8.6% |
도 | 2346 | 3.0% |
중 | 1326 | 1.7% |
남 | 1244 | 1.6% |
산 | 1166 | 1.5% |
Other values (130) | 26014 |
Space Separator
Value | Count | Frequency (%) |
10698 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 78983 | |
Common | 10698 | 11.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 9684 | 12.3% |
구 | 8553 | 10.8% |
서 | 8114 | 10.3% |
특 | 6890 | 8.7% |
별 | 6890 | 8.7% |
울 | 6756 | 8.6% |
도 | 2346 | 3.0% |
중 | 1326 | 1.7% |
남 | 1244 | 1.6% |
산 | 1166 | 1.5% |
Other values (130) | 26014 |
Common
Value | Count | Frequency (%) |
10698 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 78983 | |
ASCII | 10698 | 11.9% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
10698 |
Hangul
Value | Count | Frequency (%) |
시 | 9684 | 12.3% |
구 | 8553 | 10.8% |
서 | 8114 | 10.3% |
특 | 6890 | 8.7% |
별 | 6890 | 8.7% |
울 | 6756 | 8.6% |
도 | 2346 | 3.0% |
중 | 1326 | 1.7% |
남 | 1244 | 1.6% |
산 | 1166 | 1.5% |
Other values (130) | 26014 |
회사명
Text
Distinct | 9683 |
---|---|
Distinct (%) | 96.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
도서출판 | 766 | 5.8% |
주식회사 | 623 | 4.7% |
출판사 | 74 | 0.6% |
디자인 | 57 | 0.4% |
books | 42 | 0.3% |
사단법인 | 39 | 0.3% |
주 | 33 | 0.3% |
미디어 | 32 | 0.2% |
연구소 | 25 | 0.2% |
유한회사 | 23 | 0.2% |
Other values (10383) | 11471 |
Most occurring characters
Value | Count | Frequency (%) |
3191 | 4.5% | |
주 | 2236 | 3.2% |
사 | 2223 | 3.1% |
) | 2018 | 2.8% |
( | 1996 | 2.8% |
판 | 1643 | 2.3% |
출 | 1631 | 2.3% |
스 | 1474 | 2.1% |
이 | 1446 | 2.0% |
서 | 1314 | 1.9% |
Other values (1111) | 51701 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 56877 | |
Space Separator | 3191 | 4.5% |
Lowercase Letter | 3153 | 4.4% |
Uppercase Letter | 3050 | 4.3% |
Close Punctuation | 2020 | 2.9% |
Open Punctuation | 1998 | 2.8% |
Decimal Number | 302 | 0.4% |
Other Punctuation | 214 | 0.3% |
Dash Punctuation | 58 | 0.1% |
Other Symbol | 4 | < 0.1% |
Other values (3) | 6 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 2236 | 3.9% |
사 | 2223 | 3.9% |
판 | 1643 | 2.9% |
출 | 1631 | 2.9% |
스 | 1474 | 2.6% |
이 | 1446 | 2.5% |
서 | 1314 | 2.3% |
인 | 1246 | 2.2% |
도 | 1186 | 2.1% |
회 | 977 | 1.7% |
Other values (1027) | 41501 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 257 | 8.4% |
A | 227 | 7.4% |
O | 215 | 7.0% |
E | 202 | 6.6% |
C | 191 | 6.3% |
I | 177 | 5.8% |
B | 172 | 5.6% |
M | 164 | 5.4% |
T | 156 | 5.1% |
N | 156 | 5.1% |
Other values (16) | 1133 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 373 | |
o | 368 | |
a | 268 | 8.5% |
i | 268 | 8.5% |
n | 253 | 8.0% |
s | 218 | 6.9% |
r | 204 | 6.5% |
t | 165 | 5.2% |
l | 127 | 4.0% |
u | 106 | 3.4% |
Other values (15) | 803 |
Other Punctuation
Value | Count | Frequency (%) |
. | 104 | |
& | 69 | |
, | 24 | 11.2% |
? | 3 | 1.4% |
! | 3 | 1.4% |
· | 3 | 1.4% |
/ | 3 | 1.4% |
: | 2 | 0.9% |
@ | 2 | 0.9% |
& | 1 | 0.5% |
Decimal Number
Value | Count | Frequency (%) |
1 | 97 | |
2 | 66 | |
0 | 35 | 11.6% |
3 | 21 | 7.0% |
9 | 20 | 6.6% |
5 | 16 | 5.3% |
6 | 15 | 5.0% |
4 | 14 | 4.6% |
8 | 9 | 3.0% |
7 | 9 | 3.0% |
Math Symbol
Value | Count | Frequency (%) |
> | 2 | |
< | 1 | |
+ | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2018 | |
] | 2 | 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1996 | |
[ | 2 | 0.1% |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 3 | |
│ | 1 | 25.0% |
Space Separator
Value | Count | Frequency (%) |
3191 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 58 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 56756 | |
Common | 7790 | 11.0% |
Latin | 6203 | 8.8% |
Han | 124 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 2236 | 3.9% |
사 | 2223 | 3.9% |
판 | 1643 | 2.9% |
출 | 1631 | 2.9% |
스 | 1474 | 2.6% |
이 | 1446 | 2.5% |
서 | 1314 | 2.3% |
인 | 1246 | 2.2% |
도 | 1186 | 2.1% |
회 | 977 | 1.7% |
Other values (935) | 41380 |
Han
Value | Count | Frequency (%) |
社 | 5 | 4.0% |
文 | 4 | 3.2% |
書 | 3 | 2.4% |
院 | 3 | 2.4% |
三 | 3 | 2.4% |
人 | 3 | 2.4% |
通 | 3 | 2.4% |
冊 | 2 | 1.6% |
易 | 2 | 1.6% |
倍 | 2 | 1.6% |
Other values (83) | 94 |
Latin
Value | Count | Frequency (%) |
e | 373 | 6.0% |
o | 368 | 5.9% |
a | 268 | 4.3% |
i | 268 | 4.3% |
S | 257 | 4.1% |
n | 253 | 4.1% |
A | 227 | 3.7% |
s | 218 | 3.5% |
O | 215 | 3.5% |
r | 204 | 3.3% |
Other values (41) | 3552 |
Common
Value | Count | Frequency (%) |
3191 | ||
) | 2018 | |
( | 1996 | |
. | 104 | 1.3% |
1 | 97 | 1.2% |
& | 69 | 0.9% |
2 | 66 | 0.8% |
- | 58 | 0.7% |
0 | 35 | 0.4% |
, | 24 | 0.3% |
Other values (22) | 132 | 1.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 56752 | |
ASCII | 13985 | 19.7% |
CJK | 120 | 0.2% |
None | 10 | < 0.1% |
CJK Compat Ideographs | 4 | < 0.1% |
Compat Jamo | 1 | < 0.1% |
Box Drawing | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
3191 | ||
) | 2018 | |
( | 1996 | |
e | 373 | 2.7% |
o | 368 | 2.6% |
a | 268 | 1.9% |
i | 268 | 1.9% |
S | 257 | 1.8% |
n | 253 | 1.8% |
A | 227 | 1.6% |
Other values (69) | 4766 |
Hangul
Value | Count | Frequency (%) |
주 | 2236 | 3.9% |
사 | 2223 | 3.9% |
판 | 1643 | 2.9% |
출 | 1631 | 2.9% |
스 | 1474 | 2.6% |
이 | 1446 | 2.5% |
서 | 1314 | 2.3% |
인 | 1246 | 2.2% |
도 | 1186 | 2.1% |
회 | 977 | 1.7% |
Other values (933) | 41376 |
CJK
Value | Count | Frequency (%) |
社 | 5 | 4.2% |
文 | 4 | 3.3% |
書 | 3 | 2.5% |
院 | 3 | 2.5% |
三 | 3 | 2.5% |
人 | 3 | 2.5% |
通 | 3 | 2.5% |
冊 | 2 | 1.7% |
倍 | 2 | 1.7% |
世 | 2 | 1.7% |
Other values (80) | 90 |
None
Value | Count | Frequency (%) |
? | 3 | |
· | 3 | |
㈜ | 3 | |
& | 1 | 10.0% |
CJK Compat Ideographs
Value | Count | Frequency (%) |
易 | 2 | |
樂 | 1 | |
龍 | 1 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 1 |
Box Drawing
Value | Count | Frequency (%) |
│ | 1 |
대표자
Text
MISSING
 
Distinct | 7949 |
---|---|
Distinct (%) | 82.0% |
Missing | 304 |
Missing (%) | 3.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
주식회사 | 12 | 0.1% |
김정수 | 10 | 0.1% |
김정호 | 9 | 0.1% |
이지현 | 9 | 0.1% |
김영숙 | 8 | 0.1% |
김현수 | 8 | 0.1% |
이상훈 | 8 | 0.1% |
김정희 | 7 | 0.1% |
이재환 | 7 | 0.1% |
김성태 | 7 | 0.1% |
Other values (7970) | 9656 |
Most occurring characters
Value | Count | Frequency (%) |
김 | 2021 | 6.9% |
이 | 1466 | 5.0% |
정 | 1023 | 3.5% |
영 | 905 | 3.1% |
박 | 771 | 2.6% |
성 | 599 | 2.0% |
진 | 571 | 1.9% |
현 | 566 | 1.9% |
희 | 546 | 1.9% |
수 | 518 | 1.8% |
Other values (403) | 20512 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 29131 | |
Uppercase Letter | 237 | 0.8% |
Space Separator | 45 | 0.2% |
Lowercase Letter | 37 | 0.1% |
Close Punctuation | 17 | 0.1% |
Open Punctuation | 17 | 0.1% |
Decimal Number | 7 | < 0.1% |
Other Punctuation | 6 | < 0.1% |
Dash Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
김 | 2021 | 6.9% |
이 | 1466 | 5.0% |
정 | 1023 | 3.5% |
영 | 905 | 3.1% |
박 | 771 | 2.6% |
성 | 599 | 2.1% |
진 | 571 | 2.0% |
현 | 566 | 1.9% |
희 | 546 | 1.9% |
수 | 518 | 1.8% |
Other values (356) | 20145 |
Uppercase Letter
Value | Count | Frequency (%) |
N | 28 | 11.8% |
E | 23 | 9.7% |
A | 21 | 8.9% |
I | 17 | 7.2% |
O | 15 | 6.3% |
S | 14 | 5.9% |
G | 13 | 5.5% |
H | 12 | 5.1% |
U | 12 | 5.1% |
L | 11 | 4.6% |
Other values (14) | 71 |
Lowercase Letter
Value | Count | Frequency (%) |
n | 5 | |
e | 5 | |
a | 5 | |
o | 3 | |
g | 3 | |
s | 3 | |
m | 2 | 5.4% |
y | 2 | 5.4% |
r | 2 | 5.4% |
d | 1 | 2.7% |
Other values (6) | 6 |
Other Punctuation
Value | Count | Frequency (%) |
, | 4 | |
. | 2 |
Space Separator
Value | Count | Frequency (%) |
45 |
Close Punctuation
Value | Count | Frequency (%) |
) | 17 |
Open Punctuation
Value | Count | Frequency (%) |
( | 17 |
Decimal Number
Value | Count | Frequency (%) |
1 | 7 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 29131 | |
Latin | 274 | 0.9% |
Common | 93 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
김 | 2021 | 6.9% |
이 | 1466 | 5.0% |
정 | 1023 | 3.5% |
영 | 905 | 3.1% |
박 | 771 | 2.6% |
성 | 599 | 2.1% |
진 | 571 | 2.0% |
현 | 566 | 1.9% |
희 | 546 | 1.9% |
수 | 518 | 1.8% |
Other values (356) | 20145 |
Latin
Value | Count | Frequency (%) |
N | 28 | 10.2% |
E | 23 | 8.4% |
A | 21 | 7.7% |
I | 17 | 6.2% |
O | 15 | 5.5% |
S | 14 | 5.1% |
G | 13 | 4.7% |
H | 12 | 4.4% |
U | 12 | 4.4% |
L | 11 | 4.0% |
Other values (30) | 108 |
Common
Value | Count | Frequency (%) |
45 | ||
) | 17 | 18.3% |
( | 17 | 18.3% |
1 | 7 | 7.5% |
, | 4 | 4.3% |
. | 2 | 2.2% |
- | 1 | 1.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 29131 | |
ASCII | 367 | 1.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
김 | 2021 | 6.9% |
이 | 1466 | 5.0% |
정 | 1023 | 3.5% |
영 | 905 | 3.1% |
박 | 771 | 2.6% |
성 | 599 | 2.1% |
진 | 571 | 2.0% |
현 | 566 | 1.9% |
희 | 546 | 1.9% |
수 | 518 | 1.8% |
Other values (356) | 20145 |
ASCII
Value | Count | Frequency (%) |
45 | 12.3% | |
N | 28 | 7.6% |
E | 23 | 6.3% |
A | 21 | 5.7% |
) | 17 | 4.6% |
( | 17 | 4.6% |
I | 17 | 4.6% |
O | 15 | 4.1% |
S | 14 | 3.8% |
G | 13 | 3.5% |
Other values (37) | 157 |
주소
Text
Distinct | 233 |
---|---|
Distinct (%) | 2.3% |
Missing | 30 |
Missing (%) | 0.3% |
Memory size | 156.2 KiB |
Length
Max length | 14 |
---|---|
Median length | 9 |
Mean length | 8.9950853 |
Min length | 7 |
Characters and Unicode
Total characters | 89681 |
---|---|
Distinct characters | 141 |
Distinct categories | 2 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 17 ? |
---|---|
Unique (%) | 0.2% |
Sample
1st row | 서울특별시 중구 |
---|---|
2nd row | 서울특별시 마포구 |
3rd row | 서울특별시 서초구 |
4th row | 서울특별시 종로구 |
5th row | 서울특별시 마포구 |
Value | Count | Frequency (%) |
서울특별시 | 6619 | |
중구 | 1228 | 5.9% |
경기도 | 934 | 4.5% |
서초구 | 871 | 4.2% |
종로구 | 734 | 3.6% |
영등포구 | 571 | 2.8% |
용산구 | 418 | 2.0% |
송파구 | 377 | 1.8% |
전라북도 | 343 | 1.7% |
인천광역시 | 343 | 1.7% |
Other values (225) | 8230 |
Most occurring characters
Value | Count | Frequency (%) |
10698 | 11.9% | |
시 | 9684 | 10.8% |
구 | 8553 | 9.5% |
서 | 8114 | 9.0% |
특 | 6890 | 7.7% |
별 | 6890 | 7.7% |
울 | 6756 | 7.5% |
도 | 2346 | 2.6% |
중 | 1326 | 1.5% |
남 | 1244 | 1.4% |
Other values (131) | 27180 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 78983 | |
Space Separator | 10698 | 11.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 9684 | 12.3% |
구 | 8553 | 10.8% |
서 | 8114 | 10.3% |
특 | 6890 | 8.7% |
별 | 6890 | 8.7% |
울 | 6756 | 8.6% |
도 | 2346 | 3.0% |
중 | 1326 | 1.7% |
남 | 1244 | 1.6% |
산 | 1166 | 1.5% |
Other values (130) | 26014 |
Space Separator
Value | Count | Frequency (%) |
10698 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 78983 | |
Common | 10698 | 11.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 9684 | 12.3% |
구 | 8553 | 10.8% |
서 | 8114 | 10.3% |
특 | 6890 | 8.7% |
별 | 6890 | 8.7% |
울 | 6756 | 8.6% |
도 | 2346 | 3.0% |
중 | 1326 | 1.7% |
남 | 1244 | 1.6% |
산 | 1166 | 1.5% |
Other values (130) | 26014 |
Common
Value | Count | Frequency (%) |
10698 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 78983 | |
ASCII | 10698 | 11.9% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
10698 |
Hangul
Value | Count | Frequency (%) |
시 | 9684 | 12.3% |
구 | 8553 | 10.8% |
서 | 8114 | 10.3% |
특 | 6890 | 8.7% |
별 | 6890 | 8.7% |
울 | 6756 | 8.6% |
도 | 2346 | 3.0% |
중 | 1326 | 1.7% |
남 | 1244 | 1.6% |
산 | 1166 | 1.5% |
Other values (130) | 26014 |
구분
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
출판사 | |
---|---|
인쇄사 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 인쇄사 |
---|---|
2nd row | 출판사 |
3rd row | 출판사 |
4th row | 출판사 |
5th row | 출판사 |
Common Values
Value | Count | Frequency (%) |
출판사 | 8713 | |
인쇄사 | 1287 | 12.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
출판사 | 8713 | |
인쇄사 | 1287 | 12.9% |
영업구분
Categorical
IMBALANCE
 
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
영업 | |
---|---|
폐업 | |
전출 | |
직권말소 | 81 |
등록취소 | 70 |
Other values (3) | 60 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0406 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 영업 |
---|---|
2nd row | 영업 |
3rd row | 영업 |
4th row | 영업 |
5th row | 영업 |
Common Values
Value | Count | Frequency (%) |
영업 | 6118 | |
폐업 | 2016 | 20.2% |
전출 | 1655 | 16.6% |
직권말소 | 81 | 0.8% |
등록취소 | 70 | 0.7% |
신고취소 | 32 | 0.3% |
허가취소 | 20 | 0.2% |
전입 | 8 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
영업 | 6118 | |
폐업 | 2016 | 20.2% |
전출 | 1655 | 16.6% |
직권말소 | 81 | 0.8% |
등록취소 | 70 | 0.7% |
신고취소 | 32 | 0.3% |
허가취소 | 20 | 0.2% |
전입 | 8 | 0.1% |
등록일
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 5557 |
---|---|
Distinct (%) | 55.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20097047 |
Minimum | 19051218 |
---|---|
Maximum | 20230411 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 19051218 |
---|---|
5-th percentile | 19910702 |
Q1 | 20030512 |
median | 20111108 |
Q3 | 20190202 |
95-th percentile | 20220823 |
Maximum | 20230411 |
Range | 1179193 |
Interquartile range (IQR) | 159690.5 |
Descriptive statistics
Standard deviation | 105474.79 |
---|---|
Coefficient of variation (CV) | 0.0052482731 |
Kurtosis | 2.1884707 |
Mean | 20097047 |
Median Absolute Deviation (MAD) | 79594.5 |
Skewness | -1.0719829 |
Sum | 2.0097047 × 1011 |
Variance | 1.1124932 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20230109 | 9 | 0.1% |
20030422 | 8 | 0.1% |
20211221 | 8 | 0.1% |
20210608 | 8 | 0.1% |
20210105 | 8 | 0.1% |
20220524 | 8 | 0.1% |
20230201 | 8 | 0.1% |
20190104 | 8 | 0.1% |
20220616 | 8 | 0.1% |
20210329 | 7 | 0.1% |
Other values (5547) | 9920 |
Value | Count | Frequency (%) |
19051218 | 1 | |
19511127 | 1 | |
19520709 | 1 | |
19530212 | 1 | |
19550514 | 1 | |
19550913 | 1 | |
19551128 | 1 | |
19570111 | 1 | |
19570303 | 1 | |
19580807 | 1 |
Value | Count | Frequency (%) |
20230411 | 3 | |
20230410 | 1 | < 0.1% |
20230407 | 4 | |
20230406 | 3 | |
20230405 | 5 | |
20230404 | 2 | < 0.1% |
20230403 | 2 | < 0.1% |
20230331 | 3 | |
20230330 | 4 | |
20230329 | 6 |
개업일
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 10000 |
---|---|
Missing (%) | 100.0% |
Memory size | 166.0 KiB |
폐업일
Real number (ℝ)
HIGH CORRELATION
  MISSING
  SKEWED
 
Distinct | 2502 |
---|---|
Distinct (%) | 69.0% |
Missing | 6372 |
Missing (%) | 63.7% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20301947 |
Minimum | 19830905 |
---|---|
Maximum | 99991231 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 19830905 |
---|---|
5-th percentile | 19990215 |
Q1 | 20060810 |
median | 20140412 |
Q3 | 20200703 |
95-th percentile | 20221223 |
Maximum | 99991231 |
Range | 80160326 |
Interquartile range (IQR) | 139893.25 |
Descriptive statistics
Standard deviation | 3747585.8 |
---|---|
Coefficient of variation (CV) | 0.18459243 |
Kurtosis | 448.70183 |
Mean | 20301947 |
Median Absolute Deviation (MAD) | 69799 |
Skewness | 21.218924 |
Sum | 7.3655465 × 1010 |
Variance | 1.4044399 × 1013 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20030207 | 22 | 0.2% |
20030418 | 22 | 0.2% |
20010809 | 22 | 0.2% |
20030506 | 15 | 0.1% |
20000221 | 14 | 0.1% |
20100611 | 13 | 0.1% |
19981104 | 11 | 0.1% |
20020402 | 8 | 0.1% |
20030206 | 8 | 0.1% |
20230130 | 8 | 0.1% |
Other values (2492) | 3485 | |
(Missing) | 6372 |
Value | Count | Frequency (%) |
19830905 | 1 | |
19831020 | 1 | |
19840507 | 1 | |
19840714 | 1 | |
19841012 | 1 | |
19850208 | 1 | |
19850517 | 1 | |
19851003 | 1 | |
19851231 | 1 | |
19860208 | 1 |
Value | Count | Frequency (%) |
99991231 | 8 | |
20230410 | 1 | < 0.1% |
20230407 | 2 | < 0.1% |
20230406 | 1 | < 0.1% |
20230405 | 1 | < 0.1% |
20230404 | 1 | < 0.1% |
20230403 | 3 | < 0.1% |
20230331 | 1 | < 0.1% |
20230330 | 2 | < 0.1% |
20230329 | 1 | < 0.1% |
최종수정일
Date
Distinct | 520 |
---|---|
Distinct (%) | 5.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2021-04-01 00:00:00 |
---|---|
Maximum | 2023-04-11 00:00:00 |
순번 | 시군구코드 | 시도명 | 지역코드2 | 구분 | 영업구분 | 등록일 | 폐업일 | |
---|---|---|---|---|---|---|---|---|
순번 | 1.000 | 0.650 | 0.672 | 0.567 | 0.455 | 0.291 | 0.412 | 0.021 |
시군구코드 | 0.650 | 1.000 | 0.970 | 0.957 | 0.373 | 0.304 | 0.270 | 0.000 |
시도명 | 0.672 | 0.970 | 1.000 | 0.957 | 0.300 | 0.211 | 0.274 | 0.000 |
지역코드2 | 0.567 | 0.957 | 0.957 | 1.000 | 0.238 | 0.182 | 0.243 | 0.000 |
구분 | 0.455 | 0.373 | 0.300 | 0.238 | 1.000 | 0.164 | 0.114 | 0.000 |
영업구분 | 0.291 | 0.304 | 0.211 | 0.182 | 0.164 | 1.000 | 0.282 | 0.064 |
등록일 | 0.412 | 0.270 | 0.274 | 0.243 | 0.114 | 0.282 | 1.000 | 0.024 |
폐업일 | 0.021 | 0.000 | 0.000 | 0.000 | 0.000 | 0.064 | 0.024 | 1.000 |
구분 | 시도명 | 영업구분 | |
---|---|---|---|
구분 | 1.000 | 0.269 | 0.123 |
시도명 | 0.269 | 1.000 | 0.090 |
영업구분 | 0.123 | 0.090 | 1.000 |
순번 | 시군구코드 | 지역코드2 | 등록일 | 폐업일 | 시도명 | 구분 | 영업구분 | |
---|---|---|---|---|---|---|---|---|
순번 | 1.000 | -0.489 | -0.338 | -0.545 | -0.569 | 0.337 | 0.349 | 0.143 |
시군구코드 | -0.489 | 1.000 | 0.766 | 0.314 | 0.332 | 0.918 | 0.250 | 0.122 |
지역코드2 | -0.338 | 0.766 | 1.000 | 0.372 | 0.330 | 0.806 | 0.248 | 0.091 |
등록일 | -0.545 | 0.314 | 0.372 | 1.000 | 0.777 | 0.117 | 0.121 | 0.143 |
폐업일 | -0.569 | 0.332 | 0.330 | 0.777 | 1.000 | 0.000 | 0.000 | 0.043 |
시도명 | 0.337 | 0.918 | 0.806 | 0.117 | 0.000 | 1.000 | 0.269 | 0.090 |
구분 | 0.349 | 0.250 | 0.248 | 0.121 | 0.000 | 0.269 | 1.000 | 0.123 |
영업구분 | 0.143 | 0.122 | 0.091 | 0.143 | 0.043 | 0.090 | 0.123 | 1.000 |
순번 | 시군구코드 | 시도명 | 지역코드2 | 시군구명 | 회사명 | 대표자 | 주소 | 구분 | 영업구분 | 등록일 | 개업일 | 폐업일 | 최종수정일 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
38942 | 38943 | 6110000 | 서울특별시 | 3010000 | 서울특별시 중구 | 디와이프린팅 | 양승표 | 서울특별시 중구 | 인쇄사 | 영업 | 20040311 | <NA> | <NA> | 2021-04-01 |
3179 | 3180 | 6110000 | 서울특별시 | 3130000 | 서울특별시 마포구 | 트래블북스 | 서병용 | 서울특별시 마포구 | 출판사 | 영업 | 20220103 | <NA> | <NA> | 2023-02-06 |
6407 | 6408 | 6110000 | 서울특별시 | 3210000 | 서울특별시 서초구 | 파랑돌 | 김현진 | 서울특별시 서초구 | 출판사 | 영업 | 20221116 | <NA> | <NA> | 2022-11-24 |
49183 | 49184 | 6110000 | 서울특별시 | 3000000 | 서울특별시 종로구 | 책공장더불어 | 김보경 | 서울특별시 종로구 | 출판사 | 영업 | 20040826 | <NA> | <NA> | 2021-04-01 |
56619 | 56620 | 6110000 | 서울특별시 | 3180000 | 서울특별시 마포구 | 정원출판사 | 김준규 | 서울특별시 마포구 | 출판사 | 영업 | 20041223 | <NA> | <NA> | 2021-04-01 |
11674 | 11675 | 6410000 | 경기도 | 3940000 | 경기도 고양시 일산동구 | SOYUZ | 노국희 | 경기도 고양시 일산동구 | 출판사 | 영업 | 20220623 | <NA> | <NA> | 2022-06-23 |
54405 | 54406 | 6110000 | 서울특별시 | 3180000 | 서울특별시 영등포구 | 허그북 | 박보영 | 서울특별시 영등포구 | 출판사 | 영업 | 20210219 | <NA> | <NA> | 2021-04-01 |
41883 | 41884 | 6110000 | 서울특별시 | 3010000 | 서울특별시 중구 | 정수출판 | 김정수 | 서울특별시 중구 | 출판사 | 폐업 | 20090212 | <NA> | 20111121 | 2021-04-01 |
71543 | 71544 | 6110000 | 서울특별시 | 3210000 | 서울특별시 서초구 | 사슴저널사 | 전제승 | 서울특별시 서초구 | 출판사 | 폐업 | 19990806 | <NA> | 20010419 | 2021-04-01 |
5608 | 5609 | 6410000 | 경기도 | 5530000 | 경기도 화성시 | 도서출판 문곰 | 신대섭 | 경기도 화성시 | 출판사 | 영업 | 20220823 | <NA> | <NA> | 2022-12-15 |
순번 | 시군구코드 | 시도명 | 지역코드2 | 시군구명 | 회사명 | 대표자 | 주소 | 구분 | 영업구분 | 등록일 | 개업일 | 폐업일 | 최종수정일 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
6168 | 6169 | 6110000 | 서울특별시 | 3000000 | 서울특별시 종로구 | 학선재 | 박수준 | 서울특별시 종로구 | 출판사 | 영업 | 20061129 | <NA> | <NA> | 2022-12-01 |
33659 | 33660 | 6460000 | 전라남도 | 4930000 | 전라남도 해남군 | 해남인쇄문화사 | 천대진 | 전라남도 해남군 | 인쇄사 | 영업 | 20070123 | <NA> | <NA> | 2021-04-01 |
65676 | 65677 | 6110000 | 서울특별시 | 3030000 | 서울특별시 성동구 | 태양 | 강경구 | 서울특별시 성동구 | 출판사 | 영업 | 20081112 | <NA> | <NA> | 2021-04-01 |
19041 | 19042 | 6420000 | 강원도 | 4230000 | 강원도 속초시 | 동우인쇄사 | 한상학 | 강원도 속초시 | 인쇄사 | 폐업 | 19890712 | <NA> | 20120730 | 2021-12-07 |
55716 | 55717 | 6110000 | 서울특별시 | 3180000 | 서울특별시 영등포구 | JM애드 | 문종수 | 서울특별시 영등포구 | 출판사 | 영업 | 20110609 | <NA> | <NA> | 2021-04-01 |
20465 | 20466 | 6110000 | 서울특별시 | 3010000 | 서울특별시 중구 | 제이에스컴 | 설세화 | 서울특별시 중구 | 인쇄사 | 영업 | 20211028 | <NA> | <NA> | 2021-10-28 |
4860 | 4861 | 6410000 | 경기도 | 3940000 | 경기도 고양시 덕양구 | 가온비즈 | 김준연 | 경기도 고양시 덕양구 | 출판사 | 영업 | 20230103 | <NA> | <NA> | 2023-01-03 |
47514 | 47515 | 6110000 | 서울특별시 | 3000000 | 서울특별시 동대문구 | 레몬컬쳐(Lemon culture) | 이도은 | 서울특별시 동대문구 | 출판사 | 전출 | 20131226 | <NA> | 20150127 | 2021-04-01 |
63105 | 63106 | 6110000 | 서울특별시 | 3070000 | 서울특별시 마포구 | (주)월천상회 | 이한상 | 서울특별시 마포구 | 출판사 | 전출 | 20150406 | <NA> | 20170612 | 2021-04-01 |
68563 | 68564 | 6110000 | 서울특별시 | 3210000 | 서울특별시 서초구 | 웰뉴스 | 강신구 | 서울특별시 서초구 | 출판사 | 영업 | 20111202 | <NA> | <NA> | 2021-04-01 |