Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 500 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 24.5 KiB |
Average record size in memory | 50.3 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 3 |
Text | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 다음소프트 |
URL | https://bigdata.seoul.go.kr/data/selectSampleData.do?sample_data_seq=57 |
Reproduction
Analysis started | 2023-12-10 14:54:22.182263 |
---|---|
Analysis finished | 2023-12-10 14:54:23.011172 |
Duration | 0.83 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
DOC_DATE(DATE)
Real number (ℝ)
Distinct | 395 |
---|---|
Distinct (%) | 79.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20181134 |
Minimum | 20170103 |
---|---|
Maximum | 20191226 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 20170103 |
---|---|
5-th percentile | 20170304 |
Q1 | 20170883 |
median | 20180621 |
Q3 | 20190426 |
95-th percentile | 20191101 |
Maximum | 20191226 |
Range | 21123 |
Interquartile range (IQR) | 19542.25 |
Descriptive statistics
Standard deviation | 8302.3993 |
---|---|
Coefficient of variation (CV) | 0.0004113941 |
Kurtosis | -1.5306408 |
Mean | 20181134 |
Median Absolute Deviation (MAD) | 9800.5 |
Skewness | -0.090393198 |
Sum | 1.0090567 × 1010 |
Variance | 68929835 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20170716 | 5 | 1.0% |
20190118 | 3 | 0.6% |
20190715 | 3 | 0.6% |
20191111 | 3 | 0.6% |
20180524 | 3 | 0.6% |
20170620 | 3 | 0.6% |
20170326 | 3 | 0.6% |
20181217 | 3 | 0.6% |
20190222 | 3 | 0.6% |
20181107 | 3 | 0.6% |
Other values (385) | 468 |
Value | Count | Frequency (%) |
20170103 | 2 | |
20170108 | 1 | |
20170109 | 1 | |
20170111 | 1 | |
20170112 | 1 | |
20170116 | 2 | |
20170119 | 1 | |
20170123 | 1 | |
20170128 | 2 | |
20170203 | 1 |
Value | Count | Frequency (%) |
20191226 | 2 | |
20191224 | 1 | |
20191219 | 1 | |
20191215 | 1 | |
20191214 | 1 | |
20191213 | 2 | |
20191212 | 1 | |
20191206 | 1 | |
20191205 | 1 | |
20191204 | 2 |
수집소스(SOURCE)
Categorical
Distinct | 2 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
커뮤니티블로그 | |
---|---|
트위터 |
Length
Max length | 7 |
---|---|
Median length | 7 |
Mean length | 6.032 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 커뮤니티블로그 |
---|---|
2nd row | 커뮤니티블로그 |
3rd row | 트위터 |
4th row | 커뮤니티블로그 |
5th row | 커뮤니티블로그 |
Common Values
Value | Count | Frequency (%) |
커뮤니티블로그 | 379 | |
트위터 | 121 | 24.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
커뮤니티블로그 | 379 | |
트위터 | 121 | 24.2% |
행정동(DONG_NM)
Text
Distinct | 275 |
---|---|
Distinct (%) | 55.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
Value | Count | Frequency (%) |
이태원 | 13 | 2.6% |
강남 | 10 | 2.0% |
한남동 | 8 | 1.6% |
서울 | 8 | 1.6% |
합정 | 7 | 1.4% |
마포구 | 7 | 1.4% |
여의도 | 7 | 1.4% |
강변 | 6 | 1.2% |
홍대 | 6 | 1.2% |
익선동 | 5 | 1.0% |
Other values (265) | 423 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 115 | 7.3% |
역 | 94 | 5.9% |
구 | 61 | 3.9% |
대 | 43 | 2.7% |
남 | 38 | 2.4% |
강 | 37 | 2.3% |
원 | 32 | 2.0% |
서 | 32 | 2.0% |
수 | 30 | 1.9% |
신 | 26 | 1.6% |
Other values (203) | 1074 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1551 | |
Lowercase Letter | 28 | 1.8% |
Decimal Number | 3 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 115 | 7.4% |
역 | 94 | 6.1% |
구 | 61 | 3.9% |
대 | 43 | 2.8% |
남 | 38 | 2.5% |
강 | 37 | 2.4% |
원 | 32 | 2.1% |
서 | 32 | 2.1% |
수 | 30 | 1.9% |
신 | 26 | 1.7% |
Other values (194) | 1043 |
Lowercase Letter
Value | Count | Frequency (%) |
c | 8 | |
v | 5 | |
g | 5 | |
i | 4 | |
n | 2 | 7.1% |
f | 2 | 7.1% |
p | 1 | 3.6% |
k | 1 | 3.6% |
Decimal Number
Value | Count | Frequency (%) |
3 | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1551 | |
Latin | 28 | 1.8% |
Common | 3 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 115 | 7.4% |
역 | 94 | 6.1% |
구 | 61 | 3.9% |
대 | 43 | 2.8% |
남 | 38 | 2.5% |
강 | 37 | 2.4% |
원 | 32 | 2.1% |
서 | 32 | 2.1% |
수 | 30 | 1.9% |
신 | 26 | 1.7% |
Other values (194) | 1043 |
Latin
Value | Count | Frequency (%) |
c | 8 | |
v | 5 | |
g | 5 | |
i | 4 | |
n | 2 | 7.1% |
f | 2 | 7.1% |
p | 1 | 3.6% |
k | 1 | 3.6% |
Common
Value | Count | Frequency (%) |
3 | 3 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1551 | |
ASCII | 31 | 2.0% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 115 | 7.4% |
역 | 94 | 6.1% |
구 | 61 | 3.9% |
대 | 43 | 2.8% |
남 | 38 | 2.5% |
강 | 37 | 2.4% |
원 | 32 | 2.1% |
서 | 32 | 2.1% |
수 | 30 | 1.9% |
신 | 26 | 1.7% |
Other values (194) | 1043 |
ASCII
Value | Count | Frequency (%) |
c | 8 | |
v | 5 | |
g | 5 | |
i | 4 | |
3 | 3 | 9.7% |
n | 2 | 6.5% |
f | 2 | 6.5% |
p | 1 | 3.2% |
k | 1 | 3.2% |
행정구(GU_NM)
Categorical
Distinct | 25 |
---|---|
Distinct (%) | 5.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
강남구 | |
---|---|
종로구 | |
마포구 | |
용산구 | |
송파구 | |
Other values (20) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 2.978 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.2% |
Sample
1st row | 종로구 |
---|---|
2nd row | 강남구 |
3rd row | 서초구 |
4th row | 광진구 |
5th row | 관악구 |
Common Values
Value | Count | Frequency (%) |
강남구 | 73 | |
종로구 | 64 | |
마포구 | 48 | 9.6% |
용산구 | 47 | 9.4% |
송파구 | 36 | 7.2% |
중구 | 32 | 6.4% |
관악구 | 22 | 4.4% |
광진구 | 21 | 4.2% |
서초구 | 18 | 3.6% |
성동구 | 17 | 3.4% |
Other values (15) | 122 |
Length
Value | Count | Frequency (%) |
강남구 | 73 | |
종로구 | 64 | |
마포구 | 48 | 9.6% |
용산구 | 47 | 9.4% |
송파구 | 36 | 7.2% |
중구 | 32 | 6.4% |
관악구 | 22 | 4.4% |
광진구 | 21 | 4.2% |
서초구 | 18 | 3.6% |
성동구 | 17 | 3.4% |
Other values (15) | 122 |
세부키워드(KEYWORD_DETAIL)
Categorical
Distinct | 34 |
---|---|
Distinct (%) | 6.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
미식 | |
---|---|
분위기 | |
비쥬얼 | |
인스타그램 | |
입맛 | 21 |
Other values (29) |
Length
Max length | 6 |
---|---|
Median length | 5 |
Mean length | 2.804 |
Min length | 2 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 0.6% |
Sample
1st row | 분위기 |
---|---|
2nd row | 미식 |
3rd row | 백종원 |
4th row | 식감 |
5th row | 존맛 |
Common Values
Value | Count | Frequency (%) |
미식 | 124 | |
분위기 | 58 | 11.6% |
비쥬얼 | 33 | 6.6% |
인스타그램 | 25 | 5.0% |
입맛 | 21 | 4.2% |
인테리어 | 20 | 4.0% |
재료 | 19 | 3.8% |
이색메뉴 | 19 | 3.8% |
감성 | 17 | 3.4% |
식감 | 16 | 3.2% |
Other values (24) | 148 |
Length
Value | Count | Frequency (%) |
미식 | 124 | |
분위기 | 58 | 11.6% |
비쥬얼 | 33 | 6.6% |
인스타그램 | 25 | 5.0% |
입맛 | 21 | 4.2% |
인테리어 | 20 | 4.0% |
재료 | 19 | 3.8% |
이색메뉴 | 19 | 3.8% |
감성 | 17 | 3.4% |
식감 | 16 | 3.2% |
Other values (24) | 148 |
FREQ(FREQ)
Real number (ℝ)
Distinct | 18 |
---|---|
Distinct (%) | 3.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2.128 |
Minimum | 1 |
---|---|
Maximum | 44 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 2 |
95-th percentile | 6 |
Maximum | 44 |
Range | 43 |
Interquartile range (IQR) | 1 |
Descriptive statistics
Standard deviation | 4.0817812 |
---|---|
Coefficient of variation (CV) | 1.9181303 |
Kurtosis | 63.567244 |
Mean | 2.128 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 7.4000844 |
Sum | 1064 |
Variance | 16.660938 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 350 | |
2 | 72 | 14.4% |
3 | 27 | 5.4% |
4 | 16 | 3.2% |
6 | 12 | 2.4% |
5 | 7 | 1.4% |
7 | 3 | 0.6% |
14 | 2 | 0.4% |
17 | 2 | 0.4% |
12 | 1 | 0.2% |
Other values (8) | 8 | 1.6% |
Value | Count | Frequency (%) |
1 | 350 | |
2 | 72 | 14.4% |
3 | 27 | 5.4% |
4 | 16 | 3.2% |
5 | 7 | 1.4% |
6 | 12 | 2.4% |
7 | 3 | 0.6% |
9 | 1 | 0.2% |
11 | 1 | 0.2% |
12 | 1 | 0.2% |
Value | Count | Frequency (%) |
44 | 1 | |
42 | 1 | |
41 | 1 | |
30 | 1 | |
27 | 1 | |
19 | 1 | |
17 | 2 | |
14 | 2 | |
12 | 1 | |
11 | 1 |
DOC_DATE(DATE) | 수집소스(SOURCE) | 행정구(GU_NM) | 세부키워드(KEYWORD_DETAIL) | FREQ(FREQ) | |
---|---|---|---|---|---|
DOC_DATE(DATE) | 1.000 | 0.086 | 0.128 | 0.263 | 0.000 |
수집소스(SOURCE) | 0.086 | 1.000 | 0.194 | 0.070 | 0.092 |
행정구(GU_NM) | 0.128 | 0.194 | 1.000 | 0.273 | 0.046 |
세부키워드(KEYWORD_DETAIL) | 0.263 | 0.070 | 0.273 | 1.000 | 0.000 |
FREQ(FREQ) | 0.000 | 0.092 | 0.046 | 0.000 | 1.000 |
세부키워드(KEYWORD_DETAIL) | 수집소스(SOURCE) | 행정구(GU_NM) | |
---|---|---|---|
세부키워드(KEYWORD_DETAIL) | 1.000 | 0.053 | 0.066 |
수집소스(SOURCE) | 0.053 | 1.000 | 0.164 |
행정구(GU_NM) | 0.066 | 0.164 | 1.000 |
DOC_DATE(DATE) | FREQ(FREQ) | 수집소스(SOURCE) | 행정구(GU_NM) | 세부키워드(KEYWORD_DETAIL) | |
---|---|---|---|---|---|
DOC_DATE(DATE) | 1.000 | -0.030 | 0.056 | 0.074 | 0.132 |
FREQ(FREQ) | -0.030 | 1.000 | 0.097 | 0.016 | 0.000 |
수집소스(SOURCE) | 0.056 | 0.097 | 1.000 | 0.164 | 0.053 |
행정구(GU_NM) | 0.074 | 0.016 | 0.164 | 1.000 | 0.066 |
세부키워드(KEYWORD_DETAIL) | 0.132 | 0.000 | 0.053 | 0.066 | 1.000 |
DOC_DATE(DATE) | 수집소스(SOURCE) | 행정동(DONG_NM) | 행정구(GU_NM) | 세부키워드(KEYWORD_DETAIL) | FREQ(FREQ) | |
---|---|---|---|---|---|---|
0 | 20170622 | 커뮤니티블로그 | 국립현대미술관 | 종로구 | 분위기 | 1 |
1 | 20180305 | 커뮤니티블로그 | 역삼역 | 강남구 | 미식 | 2 |
2 | 20190702 | 트위터 | 해양박물관 | 서초구 | 백종원 | 1 |
3 | 20180518 | 커뮤니티블로그 | 석파정서울미술관 | 광진구 | 식감 | 1 |
4 | 20190518 | 커뮤니티블로그 | 마포 | 관악구 | 존맛 | 1 |
5 | 20170402 | 커뮤니티블로그 | 종각 | 송파구 | 사르르 | 2 |
6 | 20190616 | 커뮤니티블로그 | 용산 | 마포구 | 입맛 | 44 |
7 | 20190118 | 커뮤니티블로그 | 남부터미널 | 강남구 | 미식 | 1 |
8 | 20191008 | 커뮤니티블로그 | 이태원 | 강남구 | 포토존 | 1 |
9 | 20191007 | 트위터 | 홍대입구역 | 강남구 | 인테리어 | 2 |
DOC_DATE(DATE) | 수집소스(SOURCE) | 행정동(DONG_NM) | 행정구(GU_NM) | 세부키워드(KEYWORD_DETAIL) | FREQ(FREQ) | |
---|---|---|---|---|---|---|
490 | 20170716 | 트위터 | 강남 | 중구 | 입맛 | 6 |
491 | 20171126 | 커뮤니티블로그 | 디큐브시티 | 종로구 | 미식 | 1 |
492 | 20190909 | 커뮤니티블로그 | 이촌동 | 종로구 | 갬성 | 3 |
493 | 20190301 | 커뮤니티블로그 | 종각역 | 마포구 | 분위기 | 1 |
494 | 20190112 | 트위터 | 성수 | 용산구 | 입맛 | 7 |
495 | 20170203 | 커뮤니티블로그 | 용산구 | 종로구 | 미식 | 1 |
496 | 20180113 | 커뮤니티블로그 | 가로수길 | 강남구 | sns | 1 |
497 | 20190723 | 커뮤니티블로그 | 여의도 | 강남구 | 이색메뉴 | 2 |
498 | 20171108 | 커뮤니티블로그 | 역사박물관 | 관악구 | 미식 | 1 |
499 | 20181227 | 커뮤니티블로그 | 화곡동 | 종로구 | 미식 | 1 |