Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 52 |
Missing cells | 52 |
Missing cells (%) | 12.5% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 3.6 KiB |
Average record size in memory | 70.5 B |
Variable types
Text | 2 |
---|---|
Numeric | 3 |
Categorical | 2 |
Unsupported | 1 |
Dataset
Description | 대전광역시 전통시장 현황에 대한 데이터로 시장명, 소재지, 점포수, 종사자, 형태, 개설연도 등의 항목을 제공합니다. |
---|---|
Author | 대전광역시 |
URL | https://www.data.go.kr/data/15062573/fileData.do |
점포수 is highly overall correlated with 종사자 and 1 other fields | High correlation |
종사자 is highly overall correlated with 점포수 | High correlation |
개설연도 is highly overall correlated with 등록 | High correlation |
형태 is highly overall correlated with 점포수 and 1 other fields | High correlation |
등록 is highly overall correlated with 개설연도 and 1 other fields | High correlation |
Unnamed: 7 has 52 (100.0%) missing values | Missing |
시장명 has unique values | Unique |
소재지 has unique values | Unique |
Unnamed: 7 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2023-12-11 23:44:12.771147 |
---|---|
Analysis finished | 2023-12-11 23:44:14.147390 |
Duration | 1.38 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시장명
Text
UNIQUE
 
Distinct | 52 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 548.0 B |
Value | Count | Frequency (%) |
신 | 3 | 3.8% |
용 | 2 | 2.6% |
송 | 2 | 2.6% |
동 | 2 | 2.6% |
중 | 2 | 2.6% |
도 | 2 | 2.6% |
상점가 | 2 | 2.6% |
미르길골목형상점가 | 1 | 1.3% |
용두동 | 1 | 1.3% |
선화동음식특화거리골목형상점가 | 1 | 1.3% |
Other values (60) | 60 |
Most occurring characters
Value | Count | Frequency (%) |
가 | 29 | 8.8% |
27 | 8.2% | |
상 | 25 | 7.6% |
점 | 22 | 6.6% |
동 | 15 | 4.5% |
중 | 13 | 3.9% |
형 | 10 | 3.0% |
목 | 10 | 3.0% |
골 | 10 | 3.0% |
앙 | 9 | 2.7% |
Other values (83) | 161 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 303 | |
Space Separator | 27 | 8.2% |
Decimal Number | 1 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
가 | 29 | 9.6% |
상 | 25 | 8.3% |
점 | 22 | 7.3% |
동 | 15 | 5.0% |
중 | 13 | 4.3% |
형 | 10 | 3.3% |
목 | 10 | 3.3% |
골 | 10 | 3.3% |
앙 | 9 | 3.0% |
도 | 9 | 3.0% |
Other values (81) | 151 |
Space Separator
Value | Count | Frequency (%) |
27 |
Decimal Number
Value | Count | Frequency (%) |
3 | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 303 | |
Common | 28 | 8.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
가 | 29 | 9.6% |
상 | 25 | 8.3% |
점 | 22 | 7.3% |
동 | 15 | 5.0% |
중 | 13 | 4.3% |
형 | 10 | 3.3% |
목 | 10 | 3.3% |
골 | 10 | 3.3% |
앙 | 9 | 3.0% |
도 | 9 | 3.0% |
Other values (81) | 151 |
Common
Value | Count | Frequency (%) |
27 | ||
3 | 1 | 3.6% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 303 | |
ASCII | 28 | 8.5% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
가 | 29 | 9.6% |
상 | 25 | 8.3% |
점 | 22 | 7.3% |
동 | 15 | 5.0% |
중 | 13 | 4.3% |
형 | 10 | 3.3% |
목 | 10 | 3.3% |
골 | 10 | 3.3% |
앙 | 9 | 3.0% |
도 | 9 | 3.0% |
Other values (81) | 151 |
ASCII
Value | Count | Frequency (%) |
27 | ||
3 | 1 | 3.6% |
소재지
Text
UNIQUE
 
Distinct | 52 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 548.0 B |
Length
Max length | 18 |
---|---|
Median length | 16 |
Mean length | 13.096154 |
Min length | 8 |
Characters and Unicode
Total characters | 681 |
---|---|
Distinct characters | 70 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 52 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 동구 대전로 783 |
---|---|
2nd row | 동구 중앙로200번길 99 |
3rd row | 동구 중앙로200번길 85 |
4th row | 동구 중앙로200번길 73 |
5th row | 동구 중앙로200번길 45 |
Value | Count | Frequency (%) |
동구 | 22 | 14.1% |
중구 | 15 | 9.6% |
중앙로200번길 | 6 | 3.8% |
대덕구 | 5 | 3.2% |
서구 | 5 | 3.2% |
83 | 2 | 1.3% |
28 | 2 | 1.3% |
대전로797번길 | 2 | 1.3% |
충무로 | 2 | 1.3% |
54 | 2 | 1.3% |
Other values (93) | 93 |
Most occurring characters
Value | Count | Frequency (%) |
108 | ||
구 | 51 | 7.5% |
로 | 50 | 7.3% |
1 | 39 | 5.7% |
길 | 35 | 5.1% |
번 | 33 | 4.8% |
3 | 31 | 4.6% |
0 | 30 | 4.4% |
중 | 29 | 4.3% |
동 | 27 | 4.0% |
Other values (60) | 248 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 344 | |
Decimal Number | 221 | |
Space Separator | 108 | 15.9% |
Dash Punctuation | 8 | 1.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 51 | |
로 | 50 | |
길 | 35 | |
번 | 33 | |
중 | 29 | 8.4% |
동 | 27 | 7.8% |
대 | 18 | 5.2% |
앙 | 11 | 3.2% |
전 | 8 | 2.3% |
서 | 7 | 2.0% |
Other values (48) | 75 |
Decimal Number
Value | Count | Frequency (%) |
1 | 39 | |
3 | 31 | |
0 | 30 | |
8 | 23 | |
7 | 22 | |
2 | 19 | |
4 | 18 | |
5 | 16 | |
6 | 12 | 5.4% |
9 | 11 | 5.0% |
Space Separator
Value | Count | Frequency (%) |
108 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 8 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 344 | |
Common | 337 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 51 | |
로 | 50 | |
길 | 35 | |
번 | 33 | |
중 | 29 | 8.4% |
동 | 27 | 7.8% |
대 | 18 | 5.2% |
앙 | 11 | 3.2% |
전 | 8 | 2.3% |
서 | 7 | 2.0% |
Other values (48) | 75 |
Common
Value | Count | Frequency (%) |
108 | ||
1 | 39 | 11.6% |
3 | 31 | 9.2% |
0 | 30 | 8.9% |
8 | 23 | 6.8% |
7 | 22 | 6.5% |
2 | 19 | 5.6% |
4 | 18 | 5.3% |
5 | 16 | 4.7% |
6 | 12 | 3.6% |
Other values (2) | 19 | 5.6% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 344 | |
ASCII | 337 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
108 | ||
1 | 39 | 11.6% |
3 | 31 | 9.2% |
0 | 30 | 8.9% |
8 | 23 | 6.8% |
7 | 22 | 6.5% |
2 | 19 | 5.6% |
4 | 18 | 5.3% |
5 | 16 | 4.7% |
6 | 12 | 3.6% |
Other values (2) | 19 | 5.6% |
Hangul
Value | Count | Frequency (%) |
구 | 51 | |
로 | 50 | |
길 | 35 | |
번 | 33 | |
중 | 29 | 8.4% |
동 | 27 | 7.8% |
대 | 18 | 5.2% |
앙 | 11 | 3.2% |
전 | 8 | 2.3% |
서 | 7 | 2.0% |
Other values (48) | 75 |
점포수
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 42 |
---|---|
Distinct (%) | 80.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 168.25 |
Minimum | 15 |
---|---|
Maximum | 1173 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 600.0 B |
Quantile statistics
Minimum | 15 |
---|---|
5-th percentile | 35.65 |
Q1 | 53.25 |
median | 90 |
Q3 | 146.75 |
95-th percentile | 698.65 |
Maximum | 1173 |
Range | 1158 |
Interquartile range (IQR) | 93.5 |
Descriptive statistics
Standard deviation | 229.80861 |
---|---|
Coefficient of variation (CV) | 1.3658758 |
Kurtosis | 8.6081756 |
Mean | 168.25 |
Median Absolute Deviation (MAD) | 40 |
Skewness | 2.8786099 |
Sum | 8749 |
Variance | 52811.995 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
90 | 3 | 5.8% |
61 | 3 | 5.8% |
100 | 2 | 3.8% |
115 | 2 | 3.8% |
64 | 2 | 3.8% |
39 | 2 | 3.8% |
50 | 2 | 3.8% |
63 | 2 | 3.8% |
818 | 1 | 1.9% |
46 | 1 | 1.9% |
Other values (32) | 32 |
Value | Count | Frequency (%) |
15 | 1 | |
27 | 1 | |
34 | 1 | |
37 | 1 | |
39 | 2 | |
42 | 1 | |
43 | 1 | |
46 | 1 | |
49 | 1 | |
50 | 2 |
Value | Count | Frequency (%) |
1173 | 1 | |
870 | 1 | |
818 | 1 | |
601 | 1 | |
465 | 1 | |
395 | 1 | |
300 | 1 | |
290 | 1 | |
250 | 1 | |
240 | 1 |
종사자
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 43 |
---|---|
Distinct (%) | 82.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 342.82692 |
Minimum | 20 |
---|---|
Maximum | 2648 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 600.0 B |
Quantile statistics
Minimum | 20 |
---|---|
5-th percentile | 39.55 |
Q1 | 75.25 |
median | 109 |
Q3 | 301 |
95-th percentile | 1434 |
Maximum | 2648 |
Range | 2628 |
Interquartile range (IQR) | 225.75 |
Descriptive statistics
Standard deviation | 545.5389 |
---|---|
Coefficient of variation (CV) | 1.5912954 |
Kurtosis | 7.2860944 |
Mean | 342.82692 |
Median Absolute Deviation (MAD) | 59 |
Skewness | 2.6585873 |
Sum | 17827 |
Variance | 297612.69 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
90 | 3 | 5.8% |
80 | 3 | 5.8% |
100 | 2 | 3.8% |
120 | 2 | 3.8% |
125 | 2 | 3.8% |
70 | 2 | 3.8% |
50 | 2 | 3.8% |
879 | 1 | 1.9% |
304 | 1 | 1.9% |
1380 | 1 | 1.9% |
Other values (33) | 33 |
Value | Count | Frequency (%) |
20 | 1 | |
35 | 1 | |
39 | 1 | |
40 | 1 | |
45 | 1 | |
48 | 1 | |
50 | 2 | |
53 | 1 | |
60 | 1 | |
69 | 1 |
Value | Count | Frequency (%) |
2648 | 1 | |
2108 | 1 | |
1500 | 1 | |
1380 | 1 | |
1130 | 1 | |
1109 | 1 | |
985 | 1 | |
879 | 1 | |
600 | 1 | |
400 | 1 |
형태
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 9.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 548.0 B |
시장 | |
---|---|
상점가 | |
골목형상점가 | |
지하도상점가 | 2 |
활성화구역 | 1 |
Length
Max length | 6 |
---|---|
Median length | 2 |
Mean length | 3.1923077 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.9% |
Sample
1st row | 활성화구역 |
---|---|
2nd row | 시장 |
3rd row | 시장 |
4th row | 시장 |
5th row | 시장 |
Common Values
Value | Count | Frequency (%) |
시장 | 28 | |
상점가 | 11 | 21.2% |
골목형상점가 | 10 | 19.2% |
지하도상점가 | 2 | 3.8% |
활성화구역 | 1 | 1.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
시장 | 28 | |
상점가 | 11 | 21.2% |
골목형상점가 | 10 | 19.2% |
지하도상점가 | 2 | 3.8% |
활성화구역 | 1 | 1.9% |
등록
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 7.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 548.0 B |
등록 | |
---|---|
인정 | |
지정 | |
<NA> | 1 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0384615 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.9% |
Sample
1st row | <NA> |
---|---|
2nd row | 등록 |
3rd row | 등록 |
4th row | 등록 |
5th row | 인정 |
Common Values
Value | Count | Frequency (%) |
등록 | 25 | |
인정 | 16 | |
지정 | 10 | 19.2% |
<NA> | 1 | 1.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
등록 | 25 | |
인정 | 16 | |
지정 | 10 | 19.2% |
na | 1 | 1.9% |
개설연도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 28 |
---|---|
Distinct (%) | 53.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1994.1346 |
Minimum | 1950 |
---|---|
Maximum | 2022 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 600.0 B |
Quantile statistics
Minimum | 1950 |
---|---|
5-th percentile | 1964.75 |
Q1 | 1979.75 |
median | 1990.5 |
Q3 | 2012.25 |
95-th percentile | 2021 |
Maximum | 2022 |
Range | 72 |
Interquartile range (IQR) | 32.5 |
Descriptive statistics
Standard deviation | 19.810899 |
---|---|
Coefficient of variation (CV) | 0.0099345846 |
Kurtosis | -1.0682647 |
Mean | 1994.1346 |
Median Absolute Deviation (MAD) | 16.5 |
Skewness | -0.062332777 |
Sum | 103695 |
Variance | 392.47172 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2021 | 8 | 15.4% |
1973 | 4 | 7.7% |
2007 | 3 | 5.8% |
1982 | 3 | 5.8% |
1990 | 3 | 5.8% |
1998 | 2 | 3.8% |
1970 | 2 | 3.8% |
2016 | 2 | 3.8% |
1980 | 2 | 3.8% |
2022 | 2 | 3.8% |
Other values (18) | 21 |
Value | Count | Frequency (%) |
1950 | 1 | 1.9% |
1962 | 2 | |
1967 | 1 | 1.9% |
1970 | 2 | |
1973 | 4 | |
1975 | 2 | |
1979 | 1 | 1.9% |
1980 | 2 | |
1981 | 1 | 1.9% |
1982 | 3 |
Value | Count | Frequency (%) |
2022 | 2 | 3.8% |
2021 | 8 | |
2017 | 1 | 1.9% |
2016 | 2 | 3.8% |
2011 | 1 | 1.9% |
2008 | 1 | 1.9% |
2007 | 3 | 5.8% |
2005 | 1 | 1.9% |
2002 | 1 | 1.9% |
2000 | 1 | 1.9% |
Unnamed: 7
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 52 |
---|---|
Missing (%) | 100.0% |
Memory size | 600.0 B |
시장명 | 소재지 | 점포수 | 종사자 | 형태 | 등록 | 개설연도 | |
---|---|---|---|---|---|---|---|
시장명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
소재지 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
점포수 | 1.000 | 1.000 | 1.000 | 0.974 | 0.744 | 0.000 | 0.408 |
종사자 | 1.000 | 1.000 | 0.974 | 1.000 | 0.538 | 0.000 | 0.604 |
형태 | 1.000 | 1.000 | 0.744 | 0.538 | 1.000 | 0.744 | 0.634 |
등록 | 1.000 | 1.000 | 0.000 | 0.000 | 0.744 | 1.000 | 0.918 |
개설연도 | 1.000 | 1.000 | 0.408 | 0.604 | 0.634 | 0.918 | 1.000 |
형태 | 등록 | |
---|---|---|
형태 | 1.000 | 0.783 |
등록 | 0.783 | 1.000 |
점포수 | 종사자 | 개설연도 | 형태 | 등록 | |
---|---|---|---|---|---|
점포수 | 1.000 | 0.876 | -0.073 | 0.561 | 0.000 |
종사자 | 0.876 | 1.000 | -0.012 | 0.353 | 0.000 |
개설연도 | -0.073 | -0.012 | 1.000 | 0.406 | 0.612 |
형태 | 0.561 | 0.353 | 0.406 | 1.000 | 0.783 |
등록 | 0.000 | 0.000 | 0.612 | 0.783 | 1.000 |
시장명 | 소재지 | 점포수 | 종사자 | 형태 | 등록 | 개설연도 | Unnamed: 7 | |
---|---|---|---|---|---|---|---|---|
0 | 중앙시장 활성화구역 | 동구 대전로 783 | 818 | 879 | 활성화구역 | <NA> | 2007 | <NA> |
1 | 중앙메가프라자 | 동구 중앙로200번길 99 | 104 | 120 | 시장 | 등록 | 1973 | <NA> |
2 | 신 중 앙 | 동구 중앙로200번길 85 | 100 | 111 | 시장 | 등록 | 1975 | <NA> |
3 | 중앙도매 | 동구 중앙로200번길 73 | 90 | 100 | 시장 | 등록 | 1973 | <NA> |
4 | 중앙종합 | 동구 중앙로200번길 45 | 115 | 120 | 시장 | 인정 | 1985 | <NA> |
5 | 자유도매 | 동구 중앙로200번길 36 | 90 | 90 | 시장 | 등록 | 1981 | <NA> |
6 | 대전도매 | 동구 대전로791번길 3 | 100 | 100 | 시장 | 등록 | 1975 | <NA> |
7 | 중앙상가 | 동구 대전로797번길 37 | 300 | 300 | 시장 | 인정 | 1962 | <NA> |
8 | 전통중앙도매 | 동구 중앙로204번길 28-1 | 115 | 125 | 시장 | 인정 | 2011 | <NA> |
9 | 정원시장 | 동구 중앙로194번길 33 | 125 | 125 | 시장 | 인정 | 2017 | <NA> |
시장명 | 소재지 | 점포수 | 종사자 | 형태 | 등록 | 개설연도 | Unnamed: 7 | |
---|---|---|---|---|---|---|---|---|
42 | 유성시장골목형상점가 | 유성대로730번길 24 | 250 | 400 | 골목형상점가 | 지정 | 2022 | <NA> |
43 | 송 강 | 유성구 구즉로 74-7 | 51 | 85 | 시장 | 등록 | 2000 | <NA> |
44 | 송 촌 | 대덕구 동춘당로 83 | 55 | 80 | 시장 | 등록 | 2005 | <NA> |
45 | 중 리 | 중리남로40번길 86 201호 | 159 | 320 | 시장 | 등록 | 1988 | <NA> |
46 | 법 동 | 계족로 608번길 23-1 | 64 | 124 | 시장 | 등록 | 1995 | <NA> |
47 | 신 탄 진 | 석봉로 37번길 46-16 | 130 | 147 | 시장 | 등록 | 2002 | <NA> |
48 | 오정동상점가 | 대덕구 오정로 106 | 1173 | 2108 | 상점가 | 등록 | 2007 | <NA> |
49 | 송촌동상점가 | 대덕구 계족산로81번길 54 | 870 | 2648 | 상점가 | 등록 | 2016 | <NA> |
50 | 중리동골목형상점가 | 대덕구 중리남로 38-1 | 42 | 80 | 골목형상점가 | 지정 | 2021 | <NA> |
51 | 비래동골목형상점가 | 대덕구 비래동로 1 | 152 | 250 | 골목형상점가 | 지정 | 2021 | <NA> |