Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 500 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 28.4 KiB |
Average record size in memory | 58.3 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 4 |
Text | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 다음소프트 |
URL | https://bigdata.seoul.go.kr/data/selectSampleData.do?sample_data_seq=57 |
수집소스(SOURCE) has constant value "" | Constant |
Reproduction
Analysis started | 2023-12-10 14:54:06.283988 |
---|---|
Analysis finished | 2023-12-10 14:54:07.659333 |
Duration | 1.38 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
DOC_DATE(DATE)
Real number (ℝ)
Distinct | 400 |
---|---|
Distinct (%) | 80.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20181741 |
Minimum | 20170102 |
---|---|
Maximum | 20191224 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 20170102 |
---|---|
5-th percentile | 20170297 |
Q1 | 20171210 |
median | 20180910 |
Q3 | 20190414 |
95-th percentile | 20191110 |
Maximum | 20191224 |
Range | 21122 |
Interquartile range (IQR) | 19204 |
Descriptive statistics
Standard deviation | 7972.7707 |
---|---|
Coefficient of variation (CV) | 0.00039504871 |
Kurtosis | -1.3853248 |
Mean | 20181741 |
Median Absolute Deviation (MAD) | 9600.5 |
Skewness | -0.20531236 |
Sum | 1.009087 × 1010 |
Variance | 63565072 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20190831 | 4 | 0.8% |
20171013 | 3 | 0.6% |
20181119 | 3 | 0.6% |
20180720 | 3 | 0.6% |
20191110 | 3 | 0.6% |
20180211 | 3 | 0.6% |
20170403 | 3 | 0.6% |
20170420 | 3 | 0.6% |
20170510 | 3 | 0.6% |
20180709 | 3 | 0.6% |
Other values (390) | 469 |
Value | Count | Frequency (%) |
20170102 | 1 | |
20170104 | 1 | |
20170108 | 1 | |
20170110 | 1 | |
20170114 | 1 | |
20170115 | 1 | |
20170116 | 1 | |
20170117 | 2 | |
20170119 | 1 | |
20170123 | 1 |
Value | Count | Frequency (%) |
20191224 | 2 | |
20191223 | 1 | |
20191222 | 1 | |
20191218 | 1 | |
20191217 | 1 | |
20191215 | 1 | |
20191213 | 1 | |
20191212 | 2 | |
20191211 | 1 | |
20191209 | 1 |
수집소스(SOURCE)
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
블로그 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 블로그 |
---|---|
2nd row | 블로그 |
3rd row | 블로그 |
4th row | 블로그 |
5th row | 블로그 |
Common Values
Value | Count | Frequency (%) |
블로그 | 500 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
블로그 | 500 |
행정동(DONG_NM)
Text
Distinct | 208 |
---|---|
Distinct (%) | 41.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
Value | Count | Frequency (%) |
서울 | 29 | 5.8% |
강남역 | 14 | 2.8% |
이태원 | 11 | 2.2% |
강남 | 11 | 2.2% |
연남동 | 10 | 2.0% |
홍대 | 9 | 1.8% |
한강 | 9 | 1.8% |
망원 | 8 | 1.6% |
롯데월드 | 8 | 1.6% |
신촌 | 8 | 1.6% |
Other values (198) | 383 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 101 | 6.5% |
역 | 88 | 5.6% |
구 | 71 | 4.5% |
남 | 52 | 3.3% |
강 | 50 | 3.2% |
서 | 48 | 3.1% |
대 | 47 | 3.0% |
울 | 37 | 2.4% |
원 | 33 | 2.1% |
수 | 33 | 2.1% |
Other values (174) | 1004 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1550 | |
Lowercase Letter | 10 | 0.6% |
Decimal Number | 4 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 101 | 6.5% |
역 | 88 | 5.7% |
구 | 71 | 4.6% |
남 | 52 | 3.4% |
강 | 50 | 3.2% |
서 | 48 | 3.1% |
대 | 47 | 3.0% |
울 | 37 | 2.4% |
원 | 33 | 2.1% |
수 | 33 | 2.1% |
Other values (166) | 990 |
Lowercase Letter
Value | Count | Frequency (%) |
n | 2 | |
c | 2 | |
g | 2 | |
v | 2 | |
k | 1 | |
d | 1 |
Decimal Number
Value | Count | Frequency (%) |
3 | 3 | |
5 | 1 | 25.0% |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1550 | |
Latin | 10 | 0.6% |
Common | 4 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 101 | 6.5% |
역 | 88 | 5.7% |
구 | 71 | 4.6% |
남 | 52 | 3.4% |
강 | 50 | 3.2% |
서 | 48 | 3.1% |
대 | 47 | 3.0% |
울 | 37 | 2.4% |
원 | 33 | 2.1% |
수 | 33 | 2.1% |
Other values (166) | 990 |
Latin
Value | Count | Frequency (%) |
n | 2 | |
c | 2 | |
g | 2 | |
v | 2 | |
k | 1 | |
d | 1 |
Common
Value | Count | Frequency (%) |
3 | 3 | |
5 | 1 | 25.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1550 | |
ASCII | 14 | 0.9% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 101 | 6.5% |
역 | 88 | 5.7% |
구 | 71 | 4.6% |
남 | 52 | 3.4% |
강 | 50 | 3.2% |
서 | 48 | 3.1% |
대 | 47 | 3.0% |
울 | 37 | 2.4% |
원 | 33 | 2.1% |
수 | 33 | 2.1% |
Other values (166) | 990 |
ASCII
Value | Count | Frequency (%) |
3 | 3 | |
n | 2 | |
c | 2 | |
g | 2 | |
v | 2 | |
k | 1 | 7.1% |
5 | 1 | 7.1% |
d | 1 | 7.1% |
행정구(GU_NM)
Categorical
Distinct | 25 |
---|---|
Distinct (%) | 5.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
마포구 | |
---|---|
강남구 | |
종로구 | |
용산구 | |
서울 | |
Other values (20) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 2.928 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울 |
---|---|
2nd row | 강남구 |
3rd row | 용산구 |
4th row | 성동구 |
5th row | 강남구 |
Common Values
Value | Count | Frequency (%) |
마포구 | 80 | |
강남구 | 74 | |
종로구 | 57 | |
용산구 | 56 | |
서울 | 35 | 7.0% |
중구 | 32 | 6.4% |
서초구 | 24 | 4.8% |
송파구 | 19 | 3.8% |
성동구 | 17 | 3.4% |
영등포구 | 14 | 2.8% |
Other values (15) | 92 |
Length
Value | Count | Frequency (%) |
마포구 | 80 | |
강남구 | 74 | |
종로구 | 57 | |
용산구 | 56 | |
서울 | 35 | 7.0% |
중구 | 32 | 6.4% |
서초구 | 24 | 4.8% |
송파구 | 19 | 3.8% |
성동구 | 17 | 3.4% |
영등포구 | 14 | 2.8% |
Other values (15) | 92 |
세부견인요소(KEYWORD_DETAIL)
Categorical
Distinct | 28 |
---|---|
Distinct (%) | 5.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
인스타그램 | |
---|---|
비쥬얼 | |
이색메뉴 | |
존맛탱 | |
인생샷 | 29 |
Other values (23) |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 3.202 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | sns |
---|---|
2nd row | 식감 |
3rd row | 존맛탱 |
4th row | 인스타그램 |
5th row | 인스타그램 |
Common Values
Value | Count | Frequency (%) |
인스타그램 | 56 | 11.2% |
비쥬얼 | 44 | 8.8% |
이색메뉴 | 33 | 6.6% |
존맛탱 | 32 | 6.4% |
인생샷 | 29 | 5.8% |
식감 | 29 | 5.8% |
사진촬영 | 24 | 4.8% |
존맛 | 24 | 4.8% |
핫플레이스 | 24 | 4.8% |
포토존 | 22 | 4.4% |
Other values (18) | 183 |
Length
Value | Count | Frequency (%) |
인스타그램 | 56 | 11.2% |
비쥬얼 | 44 | 8.8% |
이색메뉴 | 33 | 6.6% |
존맛탱 | 32 | 6.4% |
인생샷 | 29 | 5.8% |
식감 | 29 | 5.8% |
사진촬영 | 24 | 4.8% |
존맛 | 24 | 4.8% |
핫플레이스 | 24 | 4.8% |
포토존 | 22 | 4.4% |
Other values (18) | 183 |
견인요소(KEYWORD)
Categorical
Distinct | 3 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
포토제닉 | |
---|---|
맛 | |
입소문 |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 2.752 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 입소문 |
---|---|
2nd row | 입소문 |
3rd row | 맛 |
4th row | 입소문 |
5th row | 포토제닉 |
Common Values
Value | Count | Frequency (%) |
포토제닉 | 216 | |
맛 | 170 | |
입소문 | 114 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
포토제닉 | 216 | |
맛 | 170 | |
입소문 | 114 |
FREQ(FREQ)
Real number (ℝ)
Distinct | 8 |
---|---|
Distinct (%) | 1.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.36 |
Minimum | 1 |
---|---|
Maximum | 12 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 1 |
95-th percentile | 3 |
Maximum | 12 |
Range | 11 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 1.0278682 |
---|---|
Coefficient of variation (CV) | 0.75578544 |
Kurtosis | 31.259866 |
Mean | 1.36 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 4.7159167 |
Sum | 680 |
Variance | 1.056513 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 407 | |
2 | 56 | 11.2% |
3 | 17 | 3.4% |
5 | 8 | 1.6% |
6 | 5 | 1.0% |
4 | 5 | 1.0% |
12 | 1 | 0.2% |
8 | 1 | 0.2% |
Value | Count | Frequency (%) |
1 | 407 | |
2 | 56 | 11.2% |
3 | 17 | 3.4% |
4 | 5 | 1.0% |
5 | 8 | 1.6% |
6 | 5 | 1.0% |
8 | 1 | 0.2% |
12 | 1 | 0.2% |
Value | Count | Frequency (%) |
12 | 1 | 0.2% |
8 | 1 | 0.2% |
6 | 5 | 1.0% |
5 | 8 | 1.6% |
4 | 5 | 1.0% |
3 | 17 | 3.4% |
2 | 56 | 11.2% |
1 | 407 |
DOC_DATE(DATE) | 행정구(GU_NM) | 세부견인요소(KEYWORD_DETAIL) | 견인요소(KEYWORD) | FREQ(FREQ) | |
---|---|---|---|---|---|
DOC_DATE(DATE) | 1.000 | 0.121 | 0.000 | 0.041 | 0.000 |
행정구(GU_NM) | 0.121 | 1.000 | 0.103 | 0.212 | 0.000 |
세부견인요소(KEYWORD_DETAIL) | 0.000 | 0.103 | 1.000 | 0.257 | 0.304 |
견인요소(KEYWORD) | 0.041 | 0.212 | 0.257 | 1.000 | 0.171 |
FREQ(FREQ) | 0.000 | 0.000 | 0.304 | 0.171 | 1.000 |
견인요소(KEYWORD) | 세부견인요소(KEYWORD_DETAIL) | 행정구(GU_NM) | |
---|---|---|---|
견인요소(KEYWORD) | 1.000 | 0.131 | 0.107 |
세부견인요소(KEYWORD_DETAIL) | 0.131 | 1.000 | 0.023 |
행정구(GU_NM) | 0.107 | 0.023 | 1.000 |
DOC_DATE(DATE) | FREQ(FREQ) | 행정구(GU_NM) | 세부견인요소(KEYWORD_DETAIL) | 견인요소(KEYWORD) | |
---|---|---|---|---|---|
DOC_DATE(DATE) | 1.000 | 0.003 | 0.063 | 0.000 | 0.034 |
FREQ(FREQ) | 0.003 | 1.000 | 0.000 | 0.116 | 0.115 |
행정구(GU_NM) | 0.063 | 0.000 | 1.000 | 0.023 | 0.107 |
세부견인요소(KEYWORD_DETAIL) | 0.000 | 0.116 | 0.023 | 1.000 | 0.131 |
견인요소(KEYWORD) | 0.034 | 0.115 | 0.107 | 0.131 | 1.000 |
DOC_DATE(DATE) | 수집소스(SOURCE) | 행정동(DONG_NM) | 행정구(GU_NM) | 세부견인요소(KEYWORD_DETAIL) | 견인요소(KEYWORD) | FREQ(FREQ) | |
---|---|---|---|---|---|---|---|
0 | 20170817 | 블로그 | 이태원 | 서울 | sns | 입소문 | 1 |
1 | 20181015 | 블로그 | 종로3가역 | 강남구 | 식감 | 입소문 | 1 |
2 | 20190831 | 블로그 | 아차산 | 용산구 | 존맛탱 | 맛 | 1 |
3 | 20170614 | 블로그 | 국회의사당 | 성동구 | 인스타그램 | 입소문 | 1 |
4 | 20180428 | 블로그 | 홍제 | 강남구 | 인스타그램 | 포토제닉 | 1 |
5 | 20180719 | 블로그 | 봉천 | 종로구 | 사진촬영 | 포토제닉 | 1 |
6 | 20180319 | 블로그 | 관악구 | 종로구 | sns | 맛 | 2 |
7 | 20191016 | 블로그 | 인사동 | 서울 | 이색메뉴 | 포토제닉 | 1 |
8 | 20180408 | 블로그 | 동대입구 | 용산구 | 셀카 | 포토제닉 | 1 |
9 | 20181027 | 블로그 | 연남동 | 동대문구 | 이색메뉴 | 포토제닉 | 1 |
DOC_DATE(DATE) | 수집소스(SOURCE) | 행정동(DONG_NM) | 행정구(GU_NM) | 세부견인요소(KEYWORD_DETAIL) | 견인요소(KEYWORD) | FREQ(FREQ) | |
---|---|---|---|---|---|---|---|
490 | 20181119 | 블로그 | 구로동 | 마포구 | 꿀맛 | 포토제닉 | 1 |
491 | 20170726 | 블로그 | 코엑스 | 송파구 | 식감 | 맛 | 1 |
492 | 20180725 | 블로그 | 서울 | 마포구 | 포토존 | 입소문 | 1 |
493 | 20180508 | 블로그 | 길동역 | 강남구 | 이색메뉴 | 맛 | 1 |
494 | 20170912 | 블로그 | 아차산 | 용산구 | 꿀맛 | 포토제닉 | 1 |
495 | 20170314 | 블로그 | 상수역 | 종로구 | 비쥬얼 | 맛 | 1 |
496 | 20180110 | 블로그 | 면목역 | 강남구 | 사진촬영 | 포토제닉 | 1 |
497 | 20180323 | 블로그 | 문래 | 서울 | 핫플레이스 | 포토제닉 | 1 |
498 | 20191108 | 블로그 | 상계 | 마포구 | 시그니처 | 맛 | 1 |
499 | 20181226 | 블로그 | 안국 | 은평구 | 비쥬얼 | 맛 | 1 |