Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 400.4 KiB |
Average record size in memory | 41.0 B |
Variable types
Numeric | 1 |
---|---|
Text | 2 |
Categorical | 1 |
Dataset
Description | 경상북도 202,675개의 소상공인 사업체 정보(상가업소 번호, 상호, 사군명, 주소) 데이터 셋 (CSV 파일) |
---|---|
Author | 경상북도 |
URL | https://www.data.go.kr/data/15096075/fileData.do |
상가업소 번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 06:48:05.672014 |
---|---|
Analysis finished | 2023-12-12 06:48:06.784547 |
Duration | 1.11 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
상가업소 번호
Real number (ℝ)
UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 50391.675 |
Minimum | 19 |
---|---|
Maximum | 100836 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 19 |
---|---|
5-th percentile | 5015.9 |
Q1 | 24935.25 |
median | 50320.5 |
Q3 | 75872.25 |
95-th percentile | 95957.8 |
Maximum | 100836 |
Range | 100817 |
Interquartile range (IQR) | 50937 |
Descriptive statistics
Standard deviation | 29243.993 |
---|---|
Coefficient of variation (CV) | 0.5803338 |
Kurtosis | -1.211919 |
Mean | 50391.675 |
Median Absolute Deviation (MAD) | 25482 |
Skewness | -0.0025858732 |
Sum | 5.0391675 × 108 |
Variance | 8.552111 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
55947 | 1 | < 0.1% |
83009 | 1 | < 0.1% |
47714 | 1 | < 0.1% |
24553 | 1 | < 0.1% |
36937 | 1 | < 0.1% |
35358 | 1 | < 0.1% |
86107 | 1 | < 0.1% |
82298 | 1 | < 0.1% |
24880 | 1 | < 0.1% |
32928 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
19 | 1 | |
25 | 1 | |
34 | 1 | |
58 | 1 | |
92 | 1 | |
108 | 1 | |
111 | 1 | |
125 | 1 | |
145 | 1 | |
146 | 1 |
Value | Count | Frequency (%) |
100836 | 1 | |
100832 | 1 | |
100815 | 1 | |
100814 | 1 | |
100813 | 1 | |
100798 | 1 | |
100797 | 1 | |
100795 | 1 | |
100788 | 1 | |
100779 | 1 |
상호
Text
Distinct | 6979 |
---|---|
Distinct (%) | 69.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
경북 | 484 | 4.8% |
주식 | 176 | 1.7% |
15 | 91 | 0.9% |
대한 | 81 | 0.8% |
86 | 66 | 0.7% |
58 | 0.6% | |
한국 | 53 | 0.5% |
88 | 53 | 0.5% |
현대 | 47 | 0.5% |
우리 | 44 | 0.4% |
Other values (4498) | 8911 |
Most occurring characters
Value | Count | Frequency (%) |
* | 45478 | |
경 | 648 | 1.0% |
주 | 591 | 0.9% |
대 | 516 | 0.8% |
북 | 511 | 0.8% |
성 | 417 | 0.6% |
이 | 364 | 0.6% |
동 | 338 | 0.5% |
한 | 307 | 0.5% |
영 | 273 | 0.4% |
Other values (839) | 16584 | 25.1% |
Most occurring categories
Value | Count | Frequency (%) |
Other Punctuation | 45503 | |
Other Letter | 18900 | |
Decimal Number | 669 | 1.0% |
Uppercase Letter | 337 | 0.5% |
Open Punctuation | 264 | 0.4% |
Close Punctuation | 237 | 0.4% |
Space Separator | 64 | 0.1% |
Lowercase Letter | 45 | 0.1% |
Dash Punctuation | 5 | < 0.1% |
Other Symbol | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
경 | 648 | 3.4% |
주 | 591 | 3.1% |
대 | 516 | 2.7% |
북 | 511 | 2.7% |
성 | 417 | 2.2% |
이 | 364 | 1.9% |
동 | 338 | 1.8% |
한 | 307 | 1.6% |
영 | 273 | 1.4% |
미 | 218 | 1.2% |
Other values (775) | 14717 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 46 | |
K | 32 | 9.5% |
G | 27 | 8.0% |
B | 26 | 7.7% |
C | 25 | 7.4% |
M | 22 | 6.5% |
J | 19 | 5.6% |
D | 18 | 5.3% |
T | 17 | 5.0% |
O | 15 | 4.5% |
Other values (13) | 90 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 6 | |
h | 5 | |
a | 4 | |
b | 4 | |
o | 4 | |
m | 3 | 6.7% |
s | 3 | 6.7% |
d | 3 | 6.7% |
c | 3 | 6.7% |
t | 2 | 4.4% |
Other values (6) | 8 |
Decimal Number
Value | Count | Frequency (%) |
8 | 230 | |
1 | 142 | |
5 | 123 | |
6 | 108 | |
9 | 34 | 5.1% |
2 | 10 | 1.5% |
7 | 7 | 1.0% |
0 | 6 | 0.9% |
3 | 5 | 0.7% |
4 | 4 | 0.6% |
Other Punctuation
Value | Count | Frequency (%) |
* | 45478 | |
. | 11 | < 0.1% |
& | 7 | < 0.1% |
! | 4 | < 0.1% |
· | 1 | < 0.1% |
' | 1 | < 0.1% |
# | 1 | < 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 252 | |
( | 12 | 4.5% |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 1 | |
℃ | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 237 |
Space Separator
Value | Count | Frequency (%) |
64 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 5 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 46744 | |
Hangul | 18899 | |
Latin | 382 | 0.6% |
Han | 2 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
경 | 648 | 3.4% |
주 | 591 | 3.1% |
대 | 516 | 2.7% |
북 | 511 | 2.7% |
성 | 417 | 2.2% |
이 | 364 | 1.9% |
동 | 338 | 1.8% |
한 | 307 | 1.6% |
영 | 273 | 1.4% |
미 | 218 | 1.2% |
Other values (774) | 14716 |
Latin
Value | Count | Frequency (%) |
S | 46 | 12.0% |
K | 32 | 8.4% |
G | 27 | 7.1% |
B | 26 | 6.8% |
C | 25 | 6.5% |
M | 22 | 5.8% |
J | 19 | 5.0% |
D | 18 | 4.7% |
T | 17 | 4.5% |
O | 15 | 3.9% |
Other values (29) | 135 |
Common
Value | Count | Frequency (%) |
* | 45478 | |
( | 252 | 0.5% |
) | 237 | 0.5% |
8 | 230 | 0.5% |
1 | 142 | 0.3% |
5 | 123 | 0.3% |
6 | 108 | 0.2% |
64 | 0.1% | |
9 | 34 | 0.1% |
( | 12 | < 0.1% |
Other values (14) | 64 | 0.1% |
Han
Value | Count | Frequency (%) |
三 | 1 | |
正 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 47112 | |
Hangul | 18898 | |
None | 14 | < 0.1% |
CJK | 2 | < 0.1% |
Letterlike Symbols | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
* | 45478 | |
( | 252 | 0.5% |
) | 237 | 0.5% |
8 | 230 | 0.5% |
1 | 142 | 0.3% |
5 | 123 | 0.3% |
6 | 108 | 0.2% |
64 | 0.1% | |
S | 46 | 0.1% |
9 | 34 | 0.1% |
Other values (50) | 398 | 0.8% |
Hangul
Value | Count | Frequency (%) |
경 | 648 | 3.4% |
주 | 591 | 3.1% |
대 | 516 | 2.7% |
북 | 511 | 2.7% |
성 | 417 | 2.2% |
이 | 364 | 1.9% |
동 | 338 | 1.8% |
한 | 307 | 1.6% |
영 | 273 | 1.4% |
미 | 218 | 1.2% |
Other values (773) | 14715 |
None
Value | Count | Frequency (%) |
( | 12 | |
· | 1 | 7.1% |
㈜ | 1 | 7.1% |
CJK
Value | Count | Frequency (%) |
三 | 1 | |
正 | 1 |
Letterlike Symbols
Value | Count | Frequency (%) |
℃ | 1 |
시군명
Categorical
Distinct | 24 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
구미시 | |
---|---|
경주시 | |
포항시 북구 | |
경산시 | |
포항시 남구 | |
Other values (19) |
Length
Max length | 6 |
---|---|
Median length | 3 |
Mean length | 3.5244 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 포항시 북구 |
---|---|
2nd row | 구미시 |
3rd row | 포항시 북구 |
4th row | 영천시 |
5th row | 칠곡군 |
Common Values
Value | Count | Frequency (%) |
구미시 | 1598 | |
경주시 | 1073 | |
포항시 북구 | 920 | 9.2% |
경산시 | 890 | 8.9% |
포항시 남구 | 828 | 8.3% |
안동시 | 624 | 6.2% |
칠곡군 | 513 | 5.1% |
김천시 | 467 | 4.7% |
영주시 | 381 | 3.8% |
영천시 | 380 | 3.8% |
Other values (14) | 2326 |
Length
Value | Count | Frequency (%) |
포항시 | 1748 | |
구미시 | 1598 | |
경주시 | 1073 | 9.1% |
북구 | 920 | 7.8% |
경산시 | 890 | 7.6% |
남구 | 828 | 7.0% |
안동시 | 624 | 5.3% |
칠곡군 | 513 | 4.4% |
김천시 | 467 | 4.0% |
영주시 | 381 | 3.2% |
Other values (15) | 2706 |
도로명주소
Text
Distinct | 9250 |
---|---|
Distinct (%) | 92.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 24 |
---|---|
Median length | 22 |
Mean length | 12.8895 |
Min length | 9 |
Characters and Unicode
Total characters | 128895 |
---|---|
Distinct characters | 398 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 8701 ? |
---|---|
Unique (%) | 87.0% |
Sample
1st row | 포항시 북구 천마로72번길 6 |
---|---|
2nd row | 구미시 산호대로33길 6-53 |
3rd row | 포항시 북구 남미질로21번길 15 |
4th row | 영천시 창신길 140-14 |
5th row | 칠곡군 한티로 626 |
Value | Count | Frequency (%) |
포항시 | 1748 | 5.5% |
구미시 | 1598 | 5.0% |
경주시 | 1073 | 3.4% |
북구 | 920 | 2.9% |
경산시 | 890 | 2.8% |
남구 | 828 | 2.6% |
안동시 | 624 | 2.0% |
칠곡군 | 513 | 1.6% |
김천시 | 467 | 1.5% |
영주시 | 381 | 1.2% |
Other values (6395) | 22707 |
Most occurring characters
Value | Count | Frequency (%) |
21749 | 16.9% | |
시 | 8183 | 6.3% |
1 | 7660 | 5.9% |
로 | 6837 | 5.3% |
길 | 5303 | 4.1% |
2 | 4873 | 3.8% |
3 | 3818 | 3.0% |
구 | 3647 | 2.8% |
4 | 3016 | 2.3% |
- | 3014 | 2.3% |
Other values (388) | 60795 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 70926 | |
Decimal Number | 33206 | |
Space Separator | 21749 | 16.9% |
Dash Punctuation | 3014 | 2.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 8183 | 11.5% |
로 | 6837 | 9.6% |
길 | 5303 | 7.5% |
구 | 3647 | 5.1% |
경 | 2606 | 3.7% |
군 | 2315 | 3.3% |
주 | 2226 | 3.1% |
포 | 1895 | 2.7% |
항 | 1794 | 2.5% |
미 | 1740 | 2.5% |
Other values (376) | 34380 |
Decimal Number
Value | Count | Frequency (%) |
1 | 7660 | |
2 | 4873 | |
3 | 3818 | |
4 | 3016 | 9.1% |
5 | 2750 | 8.3% |
6 | 2599 | 7.8% |
7 | 2312 | 7.0% |
8 | 2128 | 6.4% |
0 | 2027 | 6.1% |
9 | 2023 | 6.1% |
Space Separator
Value | Count | Frequency (%) |
21749 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3014 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 70926 | |
Common | 57969 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 8183 | 11.5% |
로 | 6837 | 9.6% |
길 | 5303 | 7.5% |
구 | 3647 | 5.1% |
경 | 2606 | 3.7% |
군 | 2315 | 3.3% |
주 | 2226 | 3.1% |
포 | 1895 | 2.7% |
항 | 1794 | 2.5% |
미 | 1740 | 2.5% |
Other values (376) | 34380 |
Common
Value | Count | Frequency (%) |
21749 | ||
1 | 7660 | 13.2% |
2 | 4873 | 8.4% |
3 | 3818 | 6.6% |
4 | 3016 | 5.2% |
- | 3014 | 5.2% |
5 | 2750 | 4.7% |
6 | 2599 | 4.5% |
7 | 2312 | 4.0% |
8 | 2128 | 3.7% |
Other values (2) | 4050 | 7.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 70926 | |
ASCII | 57969 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
21749 | ||
1 | 7660 | 13.2% |
2 | 4873 | 8.4% |
3 | 3818 | 6.6% |
4 | 3016 | 5.2% |
- | 3014 | 5.2% |
5 | 2750 | 4.7% |
6 | 2599 | 4.5% |
7 | 2312 | 4.0% |
8 | 2128 | 3.7% |
Other values (2) | 4050 | 7.0% |
Hangul
Value | Count | Frequency (%) |
시 | 8183 | 11.5% |
로 | 6837 | 9.6% |
길 | 5303 | 7.5% |
구 | 3647 | 5.1% |
경 | 2606 | 3.7% |
군 | 2315 | 3.3% |
주 | 2226 | 3.1% |
포 | 1895 | 2.7% |
항 | 1794 | 2.5% |
미 | 1740 | 2.5% |
Other values (376) | 34380 |
상가업소 번호 | 시군명 | |
---|---|---|
상가업소 번호 | 1.000 | 0.000 |
시군명 | 0.000 | 1.000 |
상가업소 번호 | 시군명 | |
---|---|---|
상가업소 번호 | 1.000 | 0.000 |
시군명 | 0.000 | 1.000 |
상가업소 번호 | 상호 | 시군명 | 도로명주소 | |
---|---|---|---|---|
55468 | 55947 | 옛날******** | 포항시 북구 | 포항시 북구 천마로72번길 6 |
79341 | 80014 | 벨라** | 구미시 | 구미시 산호대로33길 6-53 |
37126 | 37443 | 봉수****** | 포항시 북구 | 포항시 북구 남미질로21번길 15 |
41149 | 41501 | 멕시******** | 영천시 | 영천시 창신길 140-14 |
20316 | 20471 | 오리**** | 칠곡군 | 칠곡군 한티로 626 |
7400 | 7454 | 신세****** | 영천시 | 영천시 장수로 114 |
97095 | 97919 | 태광**** | 경주시 | 경주시 금성로 341 |
8826 | 8903 | 유엘***** | 울릉군 | 울릉군 도동길 253-6 |
9514 | 9598 | 강성****** | 포항시 북구 | 포항시 북구 장량중앙로 74 |
45317 | 45715 | 인덕*** | 구미시 | 구미시 상사서로 44 |
상가업소 번호 | 상호 | 시군명 | 도로명주소 | |
---|---|---|---|---|
34512 | 34805 | 돈우** | 경산시 | 경산시 청운1로 26 |
73673 | 74302 | 미영***** | 구미시 | 구미시 선산중앙로7길 13 |
98483 | 99314 | 덕천*** | 경산시 | 경산시 구룡로 90 |
12429 | 12532 | 제일** | 청송군 | 청송군 중앙로 185 |
71502 | 72117 | 양포*** | 포항시 남구 | 포항시 남구 장기로 24 |
86719 | 87445 | GS******** | 구미시 | 구미시 인동9길 13 |
81315 | 82002 | 동화**** | 구미시 | 구미시 형곡동로5길 6-10 |
19972 | 20123 | 대백****** | 김천시 | 김천시 용전1로 56 |
41678 | 42039 | 두근**** | 포항시 북구 | 포항시 북구 중흥로213번길 31 |
49041 | 49471 | 케이******* | 구미시 | 구미시 송원동로 28 |