Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 566.4 KiB |
Average record size in memory | 58.0 B |
Variable types
Numeric | 1 |
---|---|
Text | 2 |
Categorical | 3 |
Dataset
Description | 경상북도 202,675개의 소상공인 사업체 입지 유형(상가업소 번호, 상호, 시군명, 주소, 입지유형코드, 입지유형 명) 데이터 셋 (CSV 파일) |
---|---|
Author | 경상북도 |
URL | https://www.data.go.kr/data/15096081/fileData.do |
Reproduction
Analysis started | 2023-12-12 13:39:58.288872 |
---|---|
Analysis finished | 2023-12-12 13:39:59.926362 |
Duration | 1.64 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
상가업소 번호
Real number (ℝ)
UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 48324.236 |
Minimum | 21 |
---|---|
Maximum | 96101 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 21 |
---|---|
5-th percentile | 4858.45 |
Q1 | 24369.25 |
median | 48500.5 |
Q3 | 72499.25 |
95-th percentile | 91366.65 |
Maximum | 96101 |
Range | 96080 |
Interquartile range (IQR) | 48130 |
Descriptive statistics
Standard deviation | 27794.746 |
---|---|
Coefficient of variation (CV) | 0.57517198 |
Kurtosis | -1.2007869 |
Mean | 48324.236 |
Median Absolute Deviation (MAD) | 24060 |
Skewness | -0.013651015 |
Sum | 4.8324236 × 108 |
Variance | 7.7254793 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
92061 | 1 | < 0.1% |
19223 | 1 | < 0.1% |
83683 | 1 | < 0.1% |
8658 | 1 | < 0.1% |
15227 | 1 | < 0.1% |
12931 | 1 | < 0.1% |
90786 | 1 | < 0.1% |
90707 | 1 | < 0.1% |
69657 | 1 | < 0.1% |
76906 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
21 | 1 | |
40 | 1 | |
49 | 1 | |
57 | 1 | |
91 | 1 | |
108 | 1 | |
121 | 1 | |
131 | 1 | |
146 | 1 | |
149 | 1 |
Value | Count | Frequency (%) |
96101 | 1 | |
96094 | 1 | |
96091 | 1 | |
96089 | 1 | |
96074 | 1 | |
96061 | 1 | |
96055 | 1 | |
96053 | 1 | |
96052 | 1 | |
96050 | 1 |
상호
Text
Distinct | 7735 |
---|---|
Distinct (%) | 77.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 40 |
---|---|
Median length | 31 |
Mean length | 6.6033 |
Min length | 2 |
Characters and Unicode
Total characters | 66033 |
---|---|
Distinct characters | 924 |
Distinct categories | 13 ? |
Distinct scripts | 4 ? |
Distinct blocks | 6 ? |
Unique
Unique | 6944 ? |
---|---|
Unique (%) | 69.4% |
Sample
1st row | 합동* |
---|---|
2nd row | 구룡*************** |
3rd row | 신신상회 |
4th row | 곱창명가 |
5th row | 인터********** |
Value | Count | Frequency (%) |
경북 | 506 | 4.9% |
주식 | 175 | 1.7% |
15 | 89 | 0.9% |
대한 | 80 | 0.8% |
88 | 59 | 0.6% |
86 | 54 | 0.5% |
한국 | 47 | 0.5% |
현대 | 46 | 0.4% |
포항 | 36 | 0.3% |
16 | 33 | 0.3% |
Other values (6224) | 9254 |
Most occurring characters
Value | Count | Frequency (%) |
* | 35299 | |
경 | 771 | 1.2% |
주 | 691 | 1.0% |
대 | 569 | 0.9% |
북 | 548 | 0.8% |
이 | 530 | 0.8% |
식 | 471 | 0.7% |
성 | 437 | 0.7% |
동 | 427 | 0.6% |
379 | 0.6% | |
Other values (914) | 25911 |
Most occurring categories
Value | Count | Frequency (%) |
Other Punctuation | 35344 | |
Other Letter | 28243 | |
Decimal Number | 764 | 1.2% |
Uppercase Letter | 493 | 0.7% |
Space Separator | 379 | 0.6% |
Open Punctuation | 324 | 0.5% |
Close Punctuation | 292 | 0.4% |
Lowercase Letter | 182 | 0.3% |
Dash Punctuation | 7 | < 0.1% |
Other Symbol | 2 | < 0.1% |
Other values (3) | 3 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
경 | 771 | 2.7% |
주 | 691 | 2.4% |
대 | 569 | 2.0% |
북 | 548 | 1.9% |
이 | 530 | 1.9% |
식 | 471 | 1.7% |
성 | 437 | 1.5% |
동 | 427 | 1.5% |
한 | 378 | 1.3% |
스 | 326 | 1.2% |
Other values (838) | 23095 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 55 | 11.2% |
C | 43 | 8.7% |
G | 34 | 6.9% |
T | 30 | 6.1% |
K | 27 | 5.5% |
D | 26 | 5.3% |
M | 23 | 4.7% |
B | 22 | 4.5% |
A | 22 | 4.5% |
N | 22 | 4.5% |
Other values (16) | 189 |
Lowercase Letter
Value | Count | Frequency (%) |
o | 23 | |
e | 17 | 9.3% |
a | 17 | 9.3% |
h | 17 | 9.3% |
i | 14 | 7.7% |
n | 13 | 7.1% |
t | 9 | 4.9% |
r | 8 | 4.4% |
l | 8 | 4.4% |
s | 7 | 3.8% |
Other values (13) | 49 |
Decimal Number
Value | Count | Frequency (%) |
8 | 235 | |
1 | 154 | |
5 | 142 | |
6 | 91 | 11.9% |
2 | 46 | 6.0% |
9 | 29 | 3.8% |
0 | 24 | 3.1% |
7 | 17 | 2.2% |
3 | 13 | 1.7% |
4 | 13 | 1.7% |
Other Punctuation
Value | Count | Frequency (%) |
* | 35299 | |
. | 21 | 0.1% |
& | 17 | < 0.1% |
· | 3 | < 0.1% |
, | 2 | < 0.1% |
/ | 1 | < 0.1% |
! | 1 | < 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 309 | |
( | 15 | 4.6% |
Close Punctuation
Value | Count | Frequency (%) |
) | 291 | |
) | 1 | 0.3% |
Space Separator
Value | Count | Frequency (%) |
379 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 7 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 2 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 1 |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 1 |
Math Symbol
Value | Count | Frequency (%) |
+ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 37112 | |
Hangul | 28240 | |
Latin | 676 | 1.0% |
Han | 5 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
경 | 771 | 2.7% |
주 | 691 | 2.4% |
대 | 569 | 2.0% |
북 | 548 | 1.9% |
이 | 530 | 1.9% |
식 | 471 | 1.7% |
성 | 437 | 1.5% |
동 | 427 | 1.5% |
한 | 378 | 1.3% |
스 | 326 | 1.2% |
Other values (834) | 23092 |
Latin
Value | Count | Frequency (%) |
S | 55 | 8.1% |
C | 43 | 6.4% |
G | 34 | 5.0% |
T | 30 | 4.4% |
K | 27 | 4.0% |
D | 26 | 3.8% |
o | 23 | 3.4% |
M | 23 | 3.4% |
B | 22 | 3.3% |
A | 22 | 3.3% |
Other values (40) | 371 |
Common
Value | Count | Frequency (%) |
* | 35299 | |
379 | 1.0% | |
( | 309 | 0.8% |
) | 291 | 0.8% |
8 | 235 | 0.6% |
1 | 154 | 0.4% |
5 | 142 | 0.4% |
6 | 91 | 0.2% |
2 | 46 | 0.1% |
9 | 29 | 0.1% |
Other values (15) | 137 | 0.4% |
Han
Value | Count | Frequency (%) |
手 | 1 | |
肉 | 1 | |
炙 | 1 | |
三 | 1 | |
永 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 37768 | |
Hangul | 28237 | |
None | 21 | < 0.1% |
CJK | 5 | < 0.1% |
Number Forms | 1 | < 0.1% |
Compat Jamo | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
* | 35299 | |
379 | 1.0% | |
( | 309 | 0.8% |
) | 291 | 0.8% |
8 | 235 | 0.6% |
1 | 154 | 0.4% |
5 | 142 | 0.4% |
6 | 91 | 0.2% |
S | 55 | 0.1% |
2 | 46 | 0.1% |
Other values (61) | 767 | 2.0% |
Hangul
Value | Count | Frequency (%) |
경 | 771 | 2.7% |
주 | 691 | 2.4% |
대 | 569 | 2.0% |
북 | 548 | 1.9% |
이 | 530 | 1.9% |
식 | 471 | 1.7% |
성 | 437 | 1.5% |
동 | 427 | 1.5% |
한 | 378 | 1.3% |
스 | 326 | 1.2% |
Other values (832) | 23089 |
None
Value | Count | Frequency (%) |
( | 15 | |
· | 3 | 14.3% |
㈜ | 2 | 9.5% |
) | 1 | 4.8% |
CJK
Value | Count | Frequency (%) |
手 | 1 | |
肉 | 1 | |
炙 | 1 | |
三 | 1 | |
永 | 1 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 1 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 1 |
시군명
Categorical
Distinct | 24 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
구미시 | |
---|---|
경주시 | |
포항시 북구 | |
경산시 | |
포항시 남구 | |
Other values (19) |
Length
Max length | 6 |
---|---|
Median length | 3 |
Mean length | 3.537 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 포항시 북구 |
---|---|
2nd row | 포항시 남구 |
3rd row | 청도군 |
4th row | 구미시 |
5th row | 구미시 |
Common Values
Value | Count | Frequency (%) |
구미시 | 1536 | |
경주시 | 1120 | |
포항시 북구 | 959 | |
경산시 | 841 | 8.4% |
포항시 남구 | 831 | 8.3% |
안동시 | 623 | 6.2% |
칠곡군 | 512 | 5.1% |
김천시 | 459 | 4.6% |
영주시 | 428 | 4.3% |
영천시 | 394 | 3.9% |
Other values (14) | 2297 |
Length
Value | Count | Frequency (%) |
포항시 | 1790 | |
구미시 | 1536 | |
경주시 | 1120 | |
북구 | 959 | 8.1% |
경산시 | 841 | 7.1% |
남구 | 831 | 7.0% |
안동시 | 623 | 5.3% |
칠곡군 | 512 | 4.3% |
김천시 | 459 | 3.9% |
영주시 | 428 | 3.6% |
Other values (15) | 2691 |
도로명 주소
Text
Distinct | 9268 |
---|---|
Distinct (%) | 92.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 24 |
---|---|
Median length | 22 |
Mean length | 12.8689 |
Min length | 9 |
Characters and Unicode
Total characters | 128689 |
---|---|
Distinct characters | 392 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 8724 ? |
---|---|
Unique (%) | 87.2% |
Sample
1st row | 포항시 북구 중흥로225번길 7-7 |
---|---|
2nd row | 포항시 남구 호미로 247 |
3rd row | 청도군 운문사길 109 |
4th row | 구미시 임은길 44 |
5th row | 구미시 첨단기업5로 10-171 |
Value | Count | Frequency (%) |
포항시 | 1790 | 5.6% |
구미시 | 1536 | 4.8% |
경주시 | 1120 | 3.5% |
북구 | 959 | 3.0% |
경산시 | 841 | 2.6% |
남구 | 831 | 2.6% |
안동시 | 623 | 2.0% |
칠곡군 | 512 | 1.6% |
김천시 | 459 | 1.4% |
영주시 | 428 | 1.3% |
Other values (6384) | 22691 |
Most occurring characters
Value | Count | Frequency (%) |
21790 | 16.9% | |
시 | 8139 | 6.3% |
1 | 7636 | 5.9% |
로 | 6776 | 5.3% |
길 | 5335 | 4.1% |
2 | 4872 | 3.8% |
3 | 3799 | 3.0% |
구 | 3649 | 2.8% |
4 | 3015 | 2.3% |
- | 2953 | 2.3% |
Other values (382) | 60725 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 70887 | |
Decimal Number | 33059 | |
Space Separator | 21790 | 16.9% |
Dash Punctuation | 2953 | 2.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 8139 | 11.5% |
로 | 6776 | 9.6% |
길 | 5335 | 7.5% |
구 | 3649 | 5.1% |
경 | 2546 | 3.6% |
군 | 2333 | 3.3% |
주 | 2308 | 3.3% |
포 | 1959 | 2.8% |
항 | 1828 | 2.6% |
미 | 1699 | 2.4% |
Other values (370) | 34315 |
Decimal Number
Value | Count | Frequency (%) |
1 | 7636 | |
2 | 4872 | |
3 | 3799 | |
4 | 3015 | 9.1% |
5 | 2736 | 8.3% |
6 | 2591 | 7.8% |
7 | 2238 | 6.8% |
8 | 2142 | 6.5% |
0 | 2051 | 6.2% |
9 | 1979 | 6.0% |
Space Separator
Value | Count | Frequency (%) |
21790 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2953 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 70887 | |
Common | 57802 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 8139 | 11.5% |
로 | 6776 | 9.6% |
길 | 5335 | 7.5% |
구 | 3649 | 5.1% |
경 | 2546 | 3.6% |
군 | 2333 | 3.3% |
주 | 2308 | 3.3% |
포 | 1959 | 2.8% |
항 | 1828 | 2.6% |
미 | 1699 | 2.4% |
Other values (370) | 34315 |
Common
Value | Count | Frequency (%) |
21790 | ||
1 | 7636 | 13.2% |
2 | 4872 | 8.4% |
3 | 3799 | 6.6% |
4 | 3015 | 5.2% |
- | 2953 | 5.1% |
5 | 2736 | 4.7% |
6 | 2591 | 4.5% |
7 | 2238 | 3.9% |
8 | 2142 | 3.7% |
Other values (2) | 4030 | 7.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 70887 | |
ASCII | 57802 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
21790 | ||
1 | 7636 | 13.2% |
2 | 4872 | 8.4% |
3 | 3799 | 6.6% |
4 | 3015 | 5.2% |
- | 2953 | 5.1% |
5 | 2736 | 4.7% |
6 | 2591 | 4.5% |
7 | 2238 | 3.9% |
8 | 2142 | 3.7% |
Other values (2) | 4030 | 7.0% |
Hangul
Value | Count | Frequency (%) |
시 | 8139 | 11.5% |
로 | 6776 | 9.6% |
길 | 5335 | 7.5% |
구 | 3649 | 5.1% |
경 | 2546 | 3.6% |
군 | 2333 | 3.3% |
주 | 2308 | 3.3% |
포 | 1959 | 2.8% |
항 | 1828 | 2.6% |
미 | 1699 | 2.4% |
Other values (370) | 34315 |
입지유형 코드
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
0 | |
---|---|
1 | |
3 | 380 |
2 | 68 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 1 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 8524 | |
1 | 1028 | 10.3% |
3 | 380 | 3.8% |
2 | 68 | 0.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 8524 | |
1 | 1028 | 10.3% |
3 | 380 | 3.8% |
2 | 68 | 0.7% |
입지유형 명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
일반상가 | |
---|---|
집합상가 | |
전통시장 | 380 |
대규모상가 | 68 |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 4.0068 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 일반상가 |
---|---|
2nd row | 집합상가 |
3rd row | 일반상가 |
4th row | 일반상가 |
5th row | 일반상가 |
Common Values
Value | Count | Frequency (%) |
일반상가 | 8524 | |
집합상가 | 1028 | 10.3% |
전통시장 | 380 | 3.8% |
대규모상가 | 68 | 0.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
일반상가 | 8524 | |
집합상가 | 1028 | 10.3% |
전통시장 | 380 | 3.8% |
대규모상가 | 68 | 0.7% |
상가업소 번호 | 시군명 | 입지유형 코드 | 입지유형 명 | |
---|---|---|---|---|
상가업소 번호 | 1.000 | 0.043 | 0.004 | 0.004 |
시군명 | 0.043 | 1.000 | 0.232 | 0.232 |
입지유형 코드 | 0.004 | 0.232 | 1.000 | 1.000 |
입지유형 명 | 0.004 | 0.232 | 1.000 | 1.000 |
입지유형 코드 | 입지유형 명 | 시군명 | |
---|---|---|---|
입지유형 코드 | 1.000 | 1.000 | 0.112 |
입지유형 명 | 1.000 | 1.000 | 0.112 |
시군명 | 0.112 | 0.112 | 1.000 |
상가업소 번호 | 시군명 | 입지유형 코드 | 입지유형 명 | |
---|---|---|---|---|
상가업소 번호 | 1.000 | 0.016 | 0.003 | 0.003 |
시군명 | 0.016 | 1.000 | 0.112 | 0.112 |
입지유형 코드 | 0.003 | 0.112 | 1.000 | 1.000 |
입지유형 명 | 0.003 | 0.112 | 1.000 | 1.000 |
상가업소 번호 | 상호 | 시군명 | 도로명 주소 | 입지유형 코드 | 입지유형 명 | |
---|---|---|---|---|---|---|
91287 | 92061 | 합동* | 포항시 북구 | 포항시 북구 중흥로225번길 7-7 | 0 | 일반상가 |
15728 | 15849 | 구룡*************** | 포항시 남구 | 포항시 남구 호미로 247 | 1 | 집합상가 |
53368 | 53837 | 신신상회 | 청도군 | 청도군 운문사길 109 | 0 | 일반상가 |
2085 | 2097 | 곱창명가 | 구미시 | 구미시 임은길 44 | 0 | 일반상가 |
84531 | 85234 | 인터********** | 구미시 | 구미시 첨단기업5로 10-171 | 0 | 일반상가 |
77245 | 77898 | 진평***** | 구미시 | 구미시 인동36길 12 | 0 | 일반상가 |
26924 | 27151 | 한국** | 포항시 북구 | 포항시 북구 장량로32번길 78-1 | 0 | 일반상가 |
79059 | 79730 | 대로** | 구미시 | 구미시 산호대로 1133 | 0 | 일반상가 |
78974 | 79644 | 어묵천국원평점 | 구미시 | 구미시 구미중앙로 52 | 1 | 집합상가 |
54497 | 54968 | 15***** | 구미시 | 구미시 인동54길 25 | 0 | 일반상가 |
상가업소 번호 | 상호 | 시군명 | 도로명 주소 | 입지유형 코드 | 입지유형 명 | |
---|---|---|---|---|---|---|
37514 | 37836 | 경북******* | 경주시 | 경주시 원지길 10 | 0 | 일반상가 |
21058 | 21218 | 지에******** | 포항시 남구 | 포항시 남구 문덕로37번길 21 | 0 | 일반상가 |
41814 | 42177 | 칠곡************ | 칠곡군 | 칠곡군 석전로7길 58-1 | 0 | 일반상가 |
85647 | 86365 | 어모반점 | 김천시 | 김천시 아랫장터5길 17 | 0 | 일반상가 |
44837 | 45225 | 경산******** | 경산시 | 경산시 낙산길 51 | 0 | 일반상가 |
31166 | 31429 | 한성*** | 영주시 | 영주시 광복로24번길 3 | 0 | 일반상가 |
29160 | 29410 | M.******** | 경산시 | 경산시 대학로 280 | 0 | 일반상가 |
87932 | 88669 | 지에************** | 경산시 | 경산시 봉회1길 26 | 0 | 일반상가 |
2507 | 2521 | 금오***** | 구미시 | 구미시 구미중앙로13길 41-1 | 0 | 일반상가 |
53725 | 54194 | 아지터 | 경산시 | 경산시 원효로32길 29-1 | 0 | 일반상가 |