Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 1811 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 104.5 KiB |
Average record size in memory | 59.1 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 4 |
Text | 2 |
Dataset
Description | 전국의 시장 정보에 대한 데이터로 시장의 주소와 해당 시장에서의 배송 서비스와 장보기 서비스 여부 등을 항목으로 제공합니다. |
---|---|
Author | 소상공인시장진흥공단 |
URL | https://www.data.go.kr/data/15090612/fileData.do |
순번 is highly overall correlated with 시장-상점가 구분 and 1 other fields | High correlation |
시장-상점가 구분 is highly overall correlated with 순번 and 1 other fields | High correlation |
인정여부 is highly overall correlated with 순번 and 1 other fields | High correlation |
시장-상점가 구분 is highly imbalanced (51.8%) | Imbalance |
실시여부 - 1) 배송서비스 is highly imbalanced (63.6%) | Imbalance |
실시여부 - 2) 장보기서비스 is highly imbalanced (84.4%) | Imbalance |
순번 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 16:33:19.742733 |
---|---|
Analysis finished | 2023-12-12 16:33:20.530884 |
Duration | 0.79 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순번
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 1811 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 906 |
Minimum | 1 |
---|---|
Maximum | 1811 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 16.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 91.5 |
Q1 | 453.5 |
median | 906 |
Q3 | 1358.5 |
95-th percentile | 1720.5 |
Maximum | 1811 |
Range | 1810 |
Interquartile range (IQR) | 905 |
Descriptive statistics
Standard deviation | 522.93499 |
---|---|
Coefficient of variation (CV) | 0.57719093 |
Kurtosis | -1.2 |
Mean | 906 |
Median Absolute Deviation (MAD) | 453 |
Skewness | 0 |
Sum | 1640766 |
Variance | 273461 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.1% |
1191 | 1 | 0.1% |
1217 | 1 | 0.1% |
1216 | 1 | 0.1% |
1215 | 1 | 0.1% |
1214 | 1 | 0.1% |
1213 | 1 | 0.1% |
1212 | 1 | 0.1% |
1211 | 1 | 0.1% |
1210 | 1 | 0.1% |
Other values (1801) | 1801 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
1811 | 1 | |
1810 | 1 | |
1809 | 1 | |
1808 | 1 | |
1807 | 1 | |
1806 | 1 | |
1805 | 1 | |
1804 | 1 | |
1803 | 1 | |
1802 | 1 |
시장-상점가 구분
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 14.3 KiB |
전통시장 | |
---|---|
상점가 | |
지하도상점가 | 68 |
Length
Max length | 6 |
---|---|
Median length | 4 |
Mean length | 3.9514081 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 전통시장 |
---|---|
2nd row | 전통시장 |
3rd row | 전통시장 |
4th row | 전통시장 |
5th row | 전통시장 |
Common Values
Value | Count | Frequency (%) |
전통시장 | 1519 | |
상점가 | 224 | 12.4% |
지하도상점가 | 68 | 3.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
전통시장 | 1519 | |
상점가 | 224 | 12.4% |
지하도상점가 | 68 | 3.8% |
인정여부
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 14.3 KiB |
인정시장 | |
---|---|
상점가 | |
미인정시장 | 106 |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 3.9171728 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 인정시장 |
---|---|
2nd row | 인정시장 |
3rd row | 인정시장 |
4th row | 인정시장 |
5th row | 인정시장 |
Common Values
Value | Count | Frequency (%) |
인정시장 | 1449 | |
상점가 | 256 | 14.1% |
미인정시장 | 106 | 5.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
인정시장 | 1449 | |
상점가 | 256 | 14.1% |
미인정시장 | 106 | 5.9% |
지자체
Text
Distinct | 227 |
---|---|
Distinct (%) | 12.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 14.3 KiB |
Value | Count | Frequency (%) |
경남창원시 | 76 | 4.2% |
서울중구 | 39 | 2.2% |
경북포항시 | 38 | 2.1% |
경기성남시 | 28 | 1.5% |
부산부산진구 | 28 | 1.5% |
서울종로구 | 27 | 1.5% |
대구달서구 | 27 | 1.5% |
대구중구 | 25 | 1.4% |
경기수원시 | 22 | 1.2% |
경기부천시 | 21 | 1.2% |
Other values (217) | 1480 |
Most occurring characters
Value | Count | Frequency (%) |
구 | 934 | 10.5% |
시 | 719 | 8.1% |
경 | 586 | 6.6% |
남 | 477 | 5.4% |
서 | 415 | 4.7% |
울 | 374 | 4.2% |
산 | 364 | 4.1% |
북 | 363 | 4.1% |
군 | 319 | 3.6% |
부 | 267 | 3.0% |
Other values (122) | 4052 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 8870 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 934 | 10.5% |
시 | 719 | 8.1% |
경 | 586 | 6.6% |
남 | 477 | 5.4% |
서 | 415 | 4.7% |
울 | 374 | 4.2% |
산 | 364 | 4.1% |
북 | 363 | 4.1% |
군 | 319 | 3.6% |
부 | 267 | 3.0% |
Other values (122) | 4052 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 8870 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 934 | 10.5% |
시 | 719 | 8.1% |
경 | 586 | 6.6% |
남 | 477 | 5.4% |
서 | 415 | 4.7% |
울 | 374 | 4.2% |
산 | 364 | 4.1% |
북 | 363 | 4.1% |
군 | 319 | 3.6% |
부 | 267 | 3.0% |
Other values (122) | 4052 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 8870 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
구 | 934 | 10.5% |
시 | 719 | 8.1% |
경 | 586 | 6.6% |
남 | 477 | 5.4% |
서 | 415 | 4.7% |
울 | 374 | 4.2% |
산 | 364 | 4.1% |
북 | 363 | 4.1% |
군 | 319 | 3.6% |
부 | 267 | 3.0% |
Other values (122) | 4052 |
시장-상점가명
Text
Distinct | 1748 |
---|---|
Distinct (%) | 96.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 14.3 KiB |
Value | Count | Frequency (%) |
상점가 | 23 | 1.2% |
중앙시장 | 12 | 0.6% |
역전시장 | 5 | 0.3% |
동부시장 | 5 | 0.3% |
제일시장 | 4 | 0.2% |
신흥시장 | 4 | 0.2% |
서동시장 | 3 | 0.2% |
강남시장 | 3 | 0.2% |
신중앙시장 | 3 | 0.2% |
현대시장 | 3 | 0.2% |
Other values (1773) | 1813 |
Most occurring characters
Value | Count | Frequency (%) |
장 | 1552 | 13.4% |
시 | 1494 | 12.9% |
가 | 409 | 3.5% |
상 | 401 | 3.5% |
동 | 239 | 2.1% |
전 | 218 | 1.9% |
산 | 185 | 1.6% |
통 | 173 | 1.5% |
점 | 149 | 1.3% |
중 | 144 | 1.2% |
Other values (413) | 6594 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 11121 | |
Decimal Number | 123 | 1.1% |
Open Punctuation | 111 | 1.0% |
Close Punctuation | 111 | 1.0% |
Space Separator | 70 | 0.6% |
Uppercase Letter | 13 | 0.1% |
Lowercase Letter | 5 | < 0.1% |
Other Symbol | 2 | < 0.1% |
Dash Punctuation | 1 | < 0.1% |
Other Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
장 | 1552 | 14.0% |
시 | 1494 | 13.4% |
가 | 409 | 3.7% |
상 | 401 | 3.6% |
동 | 239 | 2.1% |
전 | 218 | 2.0% |
산 | 185 | 1.7% |
통 | 173 | 1.6% |
점 | 149 | 1.3% |
중 | 144 | 1.3% |
Other values (387) | 6157 |
Decimal Number
Value | Count | Frequency (%) |
5 | 65 | |
1 | 25 | 20.3% |
2 | 14 | 11.4% |
3 | 9 | 7.3% |
4 | 5 | 4.1% |
7 | 2 | 1.6% |
0 | 1 | 0.8% |
6 | 1 | 0.8% |
9 | 1 | 0.8% |
Uppercase Letter
Value | Count | Frequency (%) |
A | 3 | |
B | 3 | |
S | 2 | |
D | 2 | |
T | 1 | 7.7% |
K | 1 | 7.7% |
C | 1 | 7.7% |
Lowercase Letter
Value | Count | Frequency (%) |
a | 2 | |
m | 1 | |
e | 1 | |
b | 1 |
Open Punctuation
Value | Count | Frequency (%) |
( | 111 |
Close Punctuation
Value | Count | Frequency (%) |
) | 111 |
Space Separator
Value | Count | Frequency (%) |
70 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 2 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Other Punctuation
Value | Count | Frequency (%) |
! | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 11123 | |
Common | 417 | 3.6% |
Latin | 18 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
장 | 1552 | 14.0% |
시 | 1494 | 13.4% |
가 | 409 | 3.7% |
상 | 401 | 3.6% |
동 | 239 | 2.1% |
전 | 218 | 2.0% |
산 | 185 | 1.7% |
통 | 173 | 1.6% |
점 | 149 | 1.3% |
중 | 144 | 1.3% |
Other values (388) | 6159 |
Common
Value | Count | Frequency (%) |
( | 111 | |
) | 111 | |
70 | ||
5 | 65 | |
1 | 25 | 6.0% |
2 | 14 | 3.4% |
3 | 9 | 2.2% |
4 | 5 | 1.2% |
7 | 2 | 0.5% |
0 | 1 | 0.2% |
Other values (4) | 4 | 1.0% |
Latin
Value | Count | Frequency (%) |
A | 3 | |
B | 3 | |
S | 2 | |
a | 2 | |
D | 2 | |
m | 1 | 5.6% |
e | 1 | 5.6% |
T | 1 | 5.6% |
K | 1 | 5.6% |
b | 1 | 5.6% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 11121 | |
ASCII | 435 | 3.8% |
None | 2 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
장 | 1552 | 14.0% |
시 | 1494 | 13.4% |
가 | 409 | 3.7% |
상 | 401 | 3.6% |
동 | 239 | 2.1% |
전 | 218 | 2.0% |
산 | 185 | 1.7% |
통 | 173 | 1.6% |
점 | 149 | 1.3% |
중 | 144 | 1.3% |
Other values (387) | 6157 |
ASCII
Value | Count | Frequency (%) |
( | 111 | |
) | 111 | |
70 | ||
5 | 65 | |
1 | 25 | 5.7% |
2 | 14 | 3.2% |
3 | 9 | 2.1% |
4 | 5 | 1.1% |
A | 3 | 0.7% |
B | 3 | 0.7% |
Other values (15) | 19 | 4.4% |
None
Value | Count | Frequency (%) |
㈜ | 2 |
실시여부 - 1) 배송서비스
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 14.3 KiB |
2 | |
---|---|
1 | 126 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2 |
---|---|
2nd row | 2 |
3rd row | 1 |
4th row | 2 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
2 | 1685 | |
1 | 126 | 7.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2 | 1685 | |
1 | 126 | 7.0% |
실시여부 - 2) 장보기서비스
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 14.3 KiB |
2 | |
---|---|
1 | 41 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2 |
---|---|
2nd row | 2 |
3rd row | 2 |
4th row | 2 |
5th row | 2 |
Common Values
Value | Count | Frequency (%) |
2 | 1770 | |
1 | 41 | 2.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2 | 1770 | |
1 | 41 | 2.3% |
순번 | 시장-상점가 구분 | 인정여부 | 실시여부 - 1) 배송서비스 | 실시여부 - 2) 장보기서비스 | |
---|---|---|---|---|---|
순번 | 1.000 | 0.718 | 0.654 | 0.256 | 0.138 |
시장-상점가 구분 | 0.718 | 1.000 | 0.931 | 0.051 | 0.035 |
인정여부 | 0.654 | 0.931 | 1.000 | 0.056 | 0.041 |
실시여부 - 1) 배송서비스 | 0.256 | 0.051 | 0.056 | 1.000 | 0.554 |
실시여부 - 2) 장보기서비스 | 0.138 | 0.035 | 0.041 | 0.554 | 1.000 |
인정여부 | 실시여부 - 2) 장보기서비스 | 시장-상점가 구분 | 실시여부 - 1) 배송서비스 | |
---|---|---|---|---|
인정여부 | 1.000 | 0.068 | 0.679 | 0.093 |
실시여부 - 2) 장보기서비스 | 0.068 | 1.000 | 0.058 | 0.374 |
시장-상점가 구분 | 0.679 | 0.058 | 1.000 | 0.085 |
실시여부 - 1) 배송서비스 | 0.093 | 0.374 | 0.085 | 1.000 |
순번 | 시장-상점가 구분 | 인정여부 | 실시여부 - 1) 배송서비스 | 실시여부 - 2) 장보기서비스 | |
---|---|---|---|---|---|
순번 | 1.000 | 0.578 | 0.501 | 0.196 | 0.105 |
시장-상점가 구분 | 0.578 | 1.000 | 0.679 | 0.085 | 0.058 |
인정여부 | 0.501 | 0.679 | 1.000 | 0.093 | 0.068 |
실시여부 - 1) 배송서비스 | 0.196 | 0.085 | 0.093 | 1.000 | 0.374 |
실시여부 - 2) 장보기서비스 | 0.105 | 0.058 | 0.068 | 0.374 | 1.000 |
순번 | 시장-상점가 구분 | 인정여부 | 지자체 | 시장-상점가명 | 실시여부 - 1) 배송서비스 | 실시여부 - 2) 장보기서비스 | |
---|---|---|---|---|---|---|---|
0 | 1 | 전통시장 | 인정시장 | 서울강남구 | 강남시장 | 2 | 2 |
1 | 2 | 전통시장 | 인정시장 | 서울강남구 | 신사상가 | 2 | 2 |
2 | 3 | 전통시장 | 인정시장 | 서울강남구 | 영동전통시장 | 1 | 2 |
3 | 4 | 전통시장 | 인정시장 | 서울강남구 | 청담삼익시장 | 2 | 2 |
4 | 5 | 전통시장 | 인정시장 | 서울강동구 | 고분다리전통시장 | 1 | 2 |
5 | 6 | 전통시장 | 인정시장 | 서울강동구 | 길동복조리시장 | 1 | 2 |
6 | 7 | 전통시장 | 인정시장 | 서울강동구 | 둔촌역전통시장 | 1 | 1 |
7 | 8 | 전통시장 | 인정시장 | 서울강동구 | 명일전통시장 | 2 | 2 |
8 | 9 | 전통시장 | 인정시장 | 서울강동구 | 성내전통시장 | 2 | 2 |
9 | 10 | 전통시장 | 인정시장 | 서울강동구 | 암사종합시장 | 1 | 1 |
순번 | 시장-상점가 구분 | 인정여부 | 지자체 | 시장-상점가명 | 실시여부 - 1) 배송서비스 | 실시여부 - 2) 장보기서비스 | |
---|---|---|---|---|---|---|---|
1801 | 1802 | 지하도상점가 | 상점가 | 서울서초구 | 엔터식스 강남점 | 2 | 2 |
1802 | 1803 | 상점가 | 상점가 | 경기과천시 | 중앙동상점가 | 2 | 2 |
1803 | 1804 | 상점가 | 상점가 | 경기남양주시 | 덕소상점가 | 2 | 2 |
1804 | 1805 | 상점가 | 상점가 | 경기남양주시 | 맷돌모루상점가 | 2 | 2 |
1805 | 1806 | 상점가 | 상점가 | 경기여주시 | 강변상점가 | 2 | 2 |
1806 | 1807 | 상점가 | 상점가 | 강원태백시 | 중앙로 상점가 | 2 | 2 |
1807 | 1808 | 지하도상점가 | 상점가 | 서울종로구 | 대일상가(낙원지하상가) | 2 | 2 |
1808 | 1809 | 전통시장 | 인정시장 | 서울중구 | Team204 | 2 | 2 |
1809 | 1810 | 상점가 | 상점가 | 경기여주시 | 터미널상점가 | 2 | 2 |
1810 | 1811 | 상점가 | 상점가 | 전남여수시 | 흥국상가 | 2 | 2 |