Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 500 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 28.4 KiB |
Average record size in memory | 58.3 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 4 |
Text | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 다음소프트 |
URL | https://bigdata.seoul.go.kr/data/selectSampleData.do?sample_data_seq=57 |
수집소스(SOURCE) has constant value "" | Constant |
Reproduction
Analysis started | 2023-12-10 14:54:16.992722 |
---|---|
Analysis finished | 2023-12-10 14:54:18.238219 |
Duration | 1.25 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
DOC_DATE(DATE)
Real number (ℝ)
Distinct | 400 |
---|---|
Distinct (%) | 80.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20181990 |
Minimum | 20170101 |
---|---|
Maximum | 20191228 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 20170101 |
---|---|
5-th percentile | 20170321 |
Q1 | 20171217 |
median | 20180870 |
Q3 | 20190504 |
95-th percentile | 20191106 |
Maximum | 20191228 |
Range | 21127 |
Interquartile range (IQR) | 19287 |
Descriptive statistics
Standard deviation | 7945.5372 |
---|---|
Coefficient of variation (CV) | 0.00039369444 |
Kurtosis | -1.3715064 |
Mean | 20181990 |
Median Absolute Deviation (MAD) | 9636.5 |
Skewness | -0.24477153 |
Sum | 1.0090995 × 1010 |
Variance | 63131562 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20190415 | 5 | 1.0% |
20170529 | 5 | 1.0% |
20180625 | 3 | 0.6% |
20180511 | 3 | 0.6% |
20190325 | 3 | 0.6% |
20180527 | 3 | 0.6% |
20190801 | 3 | 0.6% |
20180324 | 3 | 0.6% |
20180812 | 3 | 0.6% |
20190506 | 3 | 0.6% |
Other values (390) | 466 |
Value | Count | Frequency (%) |
20170101 | 1 | |
20170107 | 1 | |
20170118 | 1 | |
20170119 | 1 | |
20170124 | 1 | |
20170201 | 1 | |
20170202 | 1 | |
20170203 | 1 | |
20170206 | 1 | |
20170210 | 1 |
Value | Count | Frequency (%) |
20191228 | 1 | |
20191222 | 1 | |
20191219 | 1 | |
20191218 | 2 | |
20191216 | 1 | |
20191210 | 1 | |
20191207 | 1 | |
20191203 | 1 | |
20191130 | 1 | |
20191129 | 1 |
수집소스(SOURCE)
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
블로그 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 블로그 |
---|---|
2nd row | 블로그 |
3rd row | 블로그 |
4th row | 블로그 |
5th row | 블로그 |
Common Values
Value | Count | Frequency (%) |
블로그 | 500 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
블로그 | 500 |
행정동(DONG_NM)
Text
Distinct | 234 |
---|---|
Distinct (%) | 46.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
Value | Count | Frequency (%) |
서울 | 14 | 2.8% |
홍대 | 11 | 2.2% |
익선동 | 11 | 2.2% |
이태원 | 9 | 1.8% |
성수동 | 8 | 1.6% |
강남 | 8 | 1.6% |
한남동 | 7 | 1.4% |
한강 | 6 | 1.2% |
중구 | 6 | 1.2% |
을지로 | 6 | 1.2% |
Other values (224) | 414 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 133 | 8.5% |
역 | 81 | 5.2% |
구 | 57 | 3.6% |
대 | 48 | 3.1% |
서 | 39 | 2.5% |
원 | 37 | 2.4% |
수 | 33 | 2.1% |
강 | 33 | 2.1% |
남 | 32 | 2.0% |
울 | 26 | 1.7% |
Other values (183) | 1049 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1543 | |
Lowercase Letter | 23 | 1.5% |
Decimal Number | 2 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 133 | 8.6% |
역 | 81 | 5.2% |
구 | 57 | 3.7% |
대 | 48 | 3.1% |
서 | 39 | 2.5% |
원 | 37 | 2.4% |
수 | 33 | 2.1% |
강 | 33 | 2.1% |
남 | 32 | 2.1% |
울 | 26 | 1.7% |
Other values (175) | 1024 |
Lowercase Letter
Value | Count | Frequency (%) |
c | 6 | |
v | 5 | |
g | 5 | |
n | 3 | |
d | 2 | 8.7% |
i | 1 | 4.3% |
f | 1 | 4.3% |
Decimal Number
Value | Count | Frequency (%) |
3 | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1543 | |
Latin | 23 | 1.5% |
Common | 2 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 133 | 8.6% |
역 | 81 | 5.2% |
구 | 57 | 3.7% |
대 | 48 | 3.1% |
서 | 39 | 2.5% |
원 | 37 | 2.4% |
수 | 33 | 2.1% |
강 | 33 | 2.1% |
남 | 32 | 2.1% |
울 | 26 | 1.7% |
Other values (175) | 1024 |
Latin
Value | Count | Frequency (%) |
c | 6 | |
v | 5 | |
g | 5 | |
n | 3 | |
d | 2 | 8.7% |
i | 1 | 4.3% |
f | 1 | 4.3% |
Common
Value | Count | Frequency (%) |
3 | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1543 | |
ASCII | 25 | 1.6% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 133 | 8.6% |
역 | 81 | 5.2% |
구 | 57 | 3.7% |
대 | 48 | 3.1% |
서 | 39 | 2.5% |
원 | 37 | 2.4% |
수 | 33 | 2.1% |
강 | 33 | 2.1% |
남 | 32 | 2.1% |
울 | 26 | 1.7% |
Other values (175) | 1024 |
ASCII
Value | Count | Frequency (%) |
c | 6 | |
v | 5 | |
g | 5 | |
n | 3 | |
3 | 2 | 8.0% |
d | 2 | 8.0% |
i | 1 | 4.0% |
f | 1 | 4.0% |
행정구(GU_NM)
Categorical
Distinct | 26 |
---|---|
Distinct (%) | 5.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
마포구 | |
---|---|
용산구 | |
강남구 | |
종로구 | |
중구 | |
Other values (21) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 2.992 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.2% |
Sample
1st row | 종로구 |
---|---|
2nd row | 성동구 |
3rd row | 서초구 |
4th row | 종로구 |
5th row | 동대문구 |
Common Values
Value | Count | Frequency (%) |
마포구 | 81 | |
용산구 | 64 | |
강남구 | 62 | |
종로구 | 61 | |
중구 | 23 | 4.6% |
성동구 | 23 | 4.6% |
영등포구 | 22 | 4.4% |
서울 | 19 | 3.8% |
송파구 | 19 | 3.8% |
서초구 | 18 | 3.6% |
Other values (16) | 108 |
Length
Value | Count | Frequency (%) |
마포구 | 81 | |
용산구 | 64 | |
강남구 | 62 | |
종로구 | 61 | |
중구 | 23 | 4.6% |
성동구 | 23 | 4.6% |
영등포구 | 22 | 4.4% |
서울 | 19 | 3.8% |
송파구 | 19 | 3.8% |
서초구 | 18 | 3.6% |
Other values (16) | 108 |
세부견인요소(KEYWORD_DETAIL)
Categorical
Distinct | 30 |
---|---|
Distinct (%) | 6.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
인스타그램 | |
---|---|
비쥬얼 | |
이색메뉴 | |
셀카 | |
식감 | |
Other values (25) |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 3.102 |
Min length | 2 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 0.6% |
Sample
1st row | 비쥬얼 |
---|---|
2nd row | 인스타그램 |
3rd row | 식감 |
4th row | 비쥬얼 |
5th row | 인스타그램 |
Common Values
Value | Count | Frequency (%) |
인스타그램 | 57 | 11.4% |
비쥬얼 | 46 | 9.2% |
이색메뉴 | 40 | 8.0% |
셀카 | 32 | 6.4% |
식감 | 30 | 6.0% |
존맛 | 29 | 5.8% |
미식 | 25 | 5.0% |
핫플레이스 | 25 | 5.0% |
꿀맛 | 24 | 4.8% |
셰프 | 17 | 3.4% |
Other values (20) | 175 |
Length
Value | Count | Frequency (%) |
인스타그램 | 57 | 11.4% |
비쥬얼 | 46 | 9.2% |
이색메뉴 | 40 | 8.0% |
셀카 | 32 | 6.4% |
식감 | 30 | 6.0% |
존맛 | 29 | 5.8% |
미식 | 25 | 5.0% |
핫플레이스 | 25 | 5.0% |
꿀맛 | 24 | 4.8% |
셰프 | 17 | 3.4% |
Other values (20) | 175 |
견인요소(KEYWORD)
Categorical
Distinct | 3 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
맛 | |
---|---|
포토제닉 | |
입소문 |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 2.482 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 포토제닉 |
---|---|
2nd row | 입소문 |
3rd row | 입소문 |
4th row | 포토제닉 |
5th row | 포토제닉 |
Common Values
Value | Count | Frequency (%) |
맛 | 211 | |
포토제닉 | 163 | |
입소문 | 126 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
맛 | 211 | |
포토제닉 | 163 | |
입소문 | 126 |
FREQ(FREQ)
Real number (ℝ)
Distinct | 11 |
---|---|
Distinct (%) | 2.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.4 |
Minimum | 1 |
---|---|
Maximum | 29 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 1 |
95-th percentile | 3 |
Maximum | 29 |
Range | 28 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 1.6435945 |
---|---|
Coefficient of variation (CV) | 1.1739961 |
Kurtosis | 164.0221 |
Mean | 1.4 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 10.877041 |
Sum | 700 |
Variance | 2.7014028 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 415 | |
2 | 51 | 10.2% |
3 | 16 | 3.2% |
4 | 4 | 0.8% |
5 | 3 | 0.6% |
6 | 3 | 0.6% |
7 | 3 | 0.6% |
8 | 2 | 0.4% |
9 | 1 | 0.2% |
11 | 1 | 0.2% |
Value | Count | Frequency (%) |
1 | 415 | |
2 | 51 | 10.2% |
3 | 16 | 3.2% |
4 | 4 | 0.8% |
5 | 3 | 0.6% |
6 | 3 | 0.6% |
7 | 3 | 0.6% |
8 | 2 | 0.4% |
9 | 1 | 0.2% |
11 | 1 | 0.2% |
Value | Count | Frequency (%) |
29 | 1 | 0.2% |
11 | 1 | 0.2% |
9 | 1 | 0.2% |
8 | 2 | 0.4% |
7 | 3 | 0.6% |
6 | 3 | 0.6% |
5 | 3 | 0.6% |
4 | 4 | 0.8% |
3 | 16 | 3.2% |
2 | 51 |
DOC_DATE(DATE) | 행정구(GU_NM) | 세부견인요소(KEYWORD_DETAIL) | 견인요소(KEYWORD) | FREQ(FREQ) | |
---|---|---|---|---|---|
DOC_DATE(DATE) | 1.000 | 0.285 | 0.000 | 0.063 | 0.000 |
행정구(GU_NM) | 0.285 | 1.000 | 0.263 | 0.000 | 0.000 |
세부견인요소(KEYWORD_DETAIL) | 0.000 | 0.263 | 1.000 | 0.231 | 0.404 |
견인요소(KEYWORD) | 0.063 | 0.000 | 0.231 | 1.000 | 0.038 |
FREQ(FREQ) | 0.000 | 0.000 | 0.404 | 0.038 | 1.000 |
견인요소(KEYWORD) | 세부견인요소(KEYWORD_DETAIL) | 행정구(GU_NM) | |
---|---|---|---|
견인요소(KEYWORD) | 1.000 | 0.105 | 0.000 |
세부견인요소(KEYWORD_DETAIL) | 0.105 | 1.000 | 0.065 |
행정구(GU_NM) | 0.000 | 0.065 | 1.000 |
DOC_DATE(DATE) | FREQ(FREQ) | 행정구(GU_NM) | 세부견인요소(KEYWORD_DETAIL) | 견인요소(KEYWORD) | |
---|---|---|---|---|---|
DOC_DATE(DATE) | 1.000 | 0.099 | 0.148 | 0.000 | 0.059 |
FREQ(FREQ) | 0.099 | 1.000 | 0.000 | 0.181 | 0.028 |
행정구(GU_NM) | 0.148 | 0.000 | 1.000 | 0.065 | 0.000 |
세부견인요소(KEYWORD_DETAIL) | 0.000 | 0.181 | 0.065 | 1.000 | 0.105 |
견인요소(KEYWORD) | 0.059 | 0.028 | 0.000 | 0.105 | 1.000 |
DOC_DATE(DATE) | 수집소스(SOURCE) | 행정동(DONG_NM) | 행정구(GU_NM) | 세부견인요소(KEYWORD_DETAIL) | 견인요소(KEYWORD) | FREQ(FREQ) | |
---|---|---|---|---|---|---|---|
0 | 20190403 | 블로그 | 성수동 | 종로구 | 비쥬얼 | 포토제닉 | 2 |
1 | 20190828 | 블로그 | 공릉동 | 성동구 | 인스타그램 | 입소문 | 1 |
2 | 20170329 | 블로그 | 석촌호수 | 서초구 | 식감 | 입소문 | 1 |
3 | 20191117 | 블로그 | 성수동 | 종로구 | 비쥬얼 | 포토제닉 | 1 |
4 | 20191023 | 블로그 | 정릉동 | 동대문구 | 인스타그램 | 포토제닉 | 1 |
5 | 20190716 | 블로그 | 흑석동 | 종로구 | 인스타그램 | 입소문 | 2 |
6 | 20190612 | 블로그 | 장안동 | 양천구 | 셀카 | 입소문 | 3 |
7 | 20190106 | 블로그 | 서울 | 용산구 | 인스타그램 | 맛 | 1 |
8 | 20170421 | 블로그 | 광화문 | 중구 | 셰프 | 맛 | 1 |
9 | 20170730 | 블로그 | 청담동 | 강남구 | 사진촬영 | 맛 | 1 |
DOC_DATE(DATE) | 수집소스(SOURCE) | 행정동(DONG_NM) | 행정구(GU_NM) | 세부견인요소(KEYWORD_DETAIL) | 견인요소(KEYWORD) | FREQ(FREQ) | |
---|---|---|---|---|---|---|---|
490 | 20171217 | 블로그 | 연남동 | 송파구 | 갬성 | 맛 | 1 |
491 | 20180306 | 블로그 | 충무로 | 용산구 | 포토존 | 맛 | 1 |
492 | 20180507 | 블로그 | 한강 | 광진구 | 포토존 | 맛 | 1 |
493 | 20180423 | 블로그 | 한남동 | 종로구 | 인스타그램 | 맛 | 1 |
494 | 20180126 | 블로그 | 송파구 | 강남구 | 핫플레이스 | 입소문 | 1 |
495 | 20181013 | 블로그 | 영등포구청역 | 강남구 | 시그니처 | 맛 | 1 |
496 | 20180719 | 블로그 | 녹사평 | 종로구 | 셀카 | 포토제닉 | 1 |
497 | 20170819 | 블로그 | 홍대입구 | 영등포구 | 인스타그램 | 포토제닉 | 1 |
498 | 20180806 | 블로그 | 광화문 | 중구 | 식감 | 포토제닉 | 1 |
499 | 20190623 | 블로그 | 광진구 | 용산구 | 인스타감성 | 맛 | 1 |