Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 500 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 28.4 KiB |
Average record size in memory | 58.3 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 5 |
Text | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 다음소프트 |
URL | https://bigdata.seoul.go.kr/data/selectSampleData.do?sample_data_seq=57 |
수집소스(SOURCE) has constant value "" | Constant |
FREQ(FREQ) is highly imbalanced (78.7%) | Imbalance |
Reproduction
Analysis started | 2023-12-10 14:53:55.655725 |
---|---|
Analysis finished | 2023-12-10 14:53:56.456839 |
Duration | 0.8 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
DOC_DATE(DATE)
Real number (ℝ)
Distinct | 383 |
---|---|
Distinct (%) | 76.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20180017 |
Minimum | 20170102 |
---|---|
Maximum | 20191227 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 20170102 |
---|---|
5-th percentile | 20170203 |
Q1 | 20170816 |
median | 20180622 |
Q3 | 20190206 |
95-th percentile | 20191008 |
Maximum | 20191227 |
Range | 21125 |
Interquartile range (IQR) | 19391 |
Descriptive statistics
Standard deviation | 8155.1702 |
---|---|
Coefficient of variation (CV) | 0.00040412108 |
Kurtosis | -1.4824968 |
Mean | 20180017 |
Median Absolute Deviation (MAD) | 9705.5 |
Skewness | 0.10109956 |
Sum | 1.0090008 × 1010 |
Variance | 66506802 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20180826 | 4 | 0.8% |
20191021 | 4 | 0.8% |
20170716 | 3 | 0.6% |
20190929 | 3 | 0.6% |
20190114 | 3 | 0.6% |
20180622 | 3 | 0.6% |
20170122 | 3 | 0.6% |
20180903 | 3 | 0.6% |
20170201 | 3 | 0.6% |
20170731 | 3 | 0.6% |
Other values (373) | 468 |
Value | Count | Frequency (%) |
20170102 | 1 | 0.2% |
20170103 | 1 | 0.2% |
20170107 | 1 | 0.2% |
20170108 | 2 | |
20170110 | 1 | 0.2% |
20170113 | 2 | |
20170114 | 1 | 0.2% |
20170116 | 2 | |
20170120 | 2 | |
20170122 | 3 |
Value | Count | Frequency (%) |
20191227 | 1 | |
20191223 | 1 | |
20191216 | 1 | |
20191204 | 1 | |
20191201 | 1 | |
20191130 | 2 | |
20191129 | 1 | |
20191119 | 1 | |
20191118 | 1 | |
20191115 | 1 |
수집소스(SOURCE)
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
블로그 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 블로그 |
---|---|
2nd row | 블로그 |
3rd row | 블로그 |
4th row | 블로그 |
5th row | 블로그 |
Common Values
Value | Count | Frequency (%) |
블로그 | 500 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
블로그 | 500 |
행정동(DONG_NM)
Text
Distinct | 169 |
---|---|
Distinct (%) | 33.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
Value | Count | Frequency (%) |
서울 | 42 | 8.4% |
디뮤지엄 | 22 | 4.4% |
대림미술관 | 20 | 4.0% |
예술의전당 | 18 | 3.6% |
인사동 | 13 | 2.6% |
한가람미술관 | 11 | 2.2% |
경복궁 | 10 | 2.0% |
한강 | 9 | 1.8% |
국립현대미술관 | 9 | 1.8% |
홍대 | 9 | 1.8% |
Other values (159) | 337 |
Most occurring characters
Value | Count | Frequency (%) |
술 | 100 | 5.4% |
관 | 97 | 5.2% |
서 | 87 | 4.7% |
동 | 87 | 4.7% |
미 | 76 | 4.1% |
울 | 70 | 3.8% |
대 | 66 | 3.6% |
역 | 44 | 2.4% |
한 | 39 | 2.1% |
문 | 30 | 1.6% |
Other values (169) | 1156 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1846 | |
Lowercase Letter | 5 | 0.3% |
Decimal Number | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
술 | 100 | 5.4% |
관 | 97 | 5.3% |
서 | 87 | 4.7% |
동 | 87 | 4.7% |
미 | 76 | 4.1% |
울 | 70 | 3.8% |
대 | 66 | 3.6% |
역 | 44 | 2.4% |
한 | 39 | 2.1% |
문 | 30 | 1.6% |
Other values (166) | 1150 |
Lowercase Letter
Value | Count | Frequency (%) |
k | 3 | |
n | 2 |
Decimal Number
Value | Count | Frequency (%) |
4 | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1846 | |
Latin | 5 | 0.3% |
Common | 1 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
술 | 100 | 5.4% |
관 | 97 | 5.3% |
서 | 87 | 4.7% |
동 | 87 | 4.7% |
미 | 76 | 4.1% |
울 | 70 | 3.8% |
대 | 66 | 3.6% |
역 | 44 | 2.4% |
한 | 39 | 2.1% |
문 | 30 | 1.6% |
Other values (166) | 1150 |
Latin
Value | Count | Frequency (%) |
k | 3 | |
n | 2 |
Common
Value | Count | Frequency (%) |
4 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1846 | |
ASCII | 6 | 0.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
술 | 100 | 5.4% |
관 | 97 | 5.3% |
서 | 87 | 4.7% |
동 | 87 | 4.7% |
미 | 76 | 4.1% |
울 | 70 | 3.8% |
대 | 66 | 3.6% |
역 | 44 | 2.4% |
한 | 39 | 2.1% |
문 | 30 | 1.6% |
Other values (166) | 1150 |
ASCII
Value | Count | Frequency (%) |
k | 3 | |
n | 2 | |
4 | 1 | 16.7% |
행정구(GU_NM)
Categorical
Distinct | 23 |
---|---|
Distinct (%) | 4.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
종로구 | |
---|---|
용산구 | |
서울 | |
서초구 | |
강남구 | |
Other values (18) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 2.828 |
Min length | 2 |
Unique
Unique | 6 ? |
---|---|
Unique (%) | 1.2% |
Sample
1st row | 종로구 |
---|---|
2nd row | 강남구 |
3rd row | 중구 |
4th row | 강남구 |
5th row | 강남구 |
Common Values
Value | Count | Frequency (%) |
종로구 | 129 | |
용산구 | 73 | |
서울 | 63 | |
서초구 | 49 | 9.8% |
강남구 | 46 | 9.2% |
중구 | 40 | 8.0% |
마포구 | 30 | 6.0% |
성동구 | 19 | 3.8% |
영등포구 | 11 | 2.2% |
광진구 | 9 | 1.8% |
Other values (13) | 31 | 6.2% |
Length
Value | Count | Frequency (%) |
종로구 | 129 | |
용산구 | 73 | |
서울 | 63 | |
서초구 | 49 | 9.8% |
강남구 | 46 | 9.2% |
중구 | 40 | 8.0% |
마포구 | 30 | 6.0% |
성동구 | 19 | 3.8% |
영등포구 | 11 | 2.2% |
광진구 | 9 | 1.8% |
Other values (13) | 31 | 6.2% |
세부견인요소(KEYWORD_DETAIL)
Categorical
Distinct | 42 |
---|---|
Distinct (%) | 8.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
작품 | |
---|---|
작가 | |
전시장 | |
예술 | |
인스타그램 | 20 |
Other values (37) |
Length
Max length | 5 |
---|---|
Median length | 2 |
Mean length | 2.64 |
Min length | 2 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 0.8% |
Sample
1st row | 화가 |
---|---|
2nd row | 포스터 |
3rd row | 도슨트 |
4th row | 예술 |
5th row | 촬영 |
Common Values
Value | Count | Frequency (%) |
작품 | 72 | 14.4% |
작가 | 49 | 9.8% |
전시장 | 38 | 7.6% |
예술 | 32 | 6.4% |
인스타그램 | 20 | 4.0% |
화가 | 19 | 3.8% |
포토존 | 19 | 3.8% |
인테리어 | 18 | 3.6% |
셀카 | 17 | 3.4% |
촬영 | 17 | 3.4% |
Other values (32) | 199 |
Length
Value | Count | Frequency (%) |
작품 | 72 | 14.4% |
작가 | 49 | 9.8% |
전시장 | 38 | 7.6% |
예술 | 32 | 6.4% |
인스타그램 | 20 | 4.0% |
화가 | 19 | 3.8% |
포토존 | 19 | 3.8% |
인테리어 | 18 | 3.6% |
촬영 | 17 | 3.4% |
셀카 | 17 | 3.4% |
Other values (32) | 199 |
견인요소(KEYWORD)
Categorical
Distinct | 4 |
---|---|
Distinct (%) | 0.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
기타 | |
---|---|
예술성 | |
감성사진 | |
건축 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.65 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 기타 |
---|---|
2nd row | 감성사진 |
3rd row | 건축 |
4th row | 기타 |
5th row | 예술성 |
Common Values
Value | Count | Frequency (%) |
기타 | 204 | |
예술성 | 113 | |
감성사진 | 106 | |
건축 | 77 | 15.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
기타 | 204 | |
예술성 | 113 | |
감성사진 | 106 | |
건축 | 77 | 15.4% |
FREQ(FREQ)
Categorical
IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
1 | |
---|---|
2 | 32 |
3 | 6 |
4 | 2 |
5 | 1 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.2% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 459 | |
2 | 32 | 6.4% |
3 | 6 | 1.2% |
4 | 2 | 0.4% |
5 | 1 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 459 | |
2 | 32 | 6.4% |
3 | 6 | 1.2% |
4 | 2 | 0.4% |
5 | 1 | 0.2% |
DOC_DATE(DATE) | 행정구(GU_NM) | 세부견인요소(KEYWORD_DETAIL) | 견인요소(KEYWORD) | FREQ(FREQ) | |
---|---|---|---|---|---|
DOC_DATE(DATE) | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 |
행정구(GU_NM) | 0.000 | 1.000 | 0.342 | 0.043 | 0.000 |
세부견인요소(KEYWORD_DETAIL) | 0.000 | 0.342 | 1.000 | 0.000 | 0.000 |
견인요소(KEYWORD) | 0.000 | 0.043 | 0.000 | 1.000 | 0.000 |
FREQ(FREQ) | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
견인요소(KEYWORD) | 세부견인요소(KEYWORD_DETAIL) | 행정구(GU_NM) | FREQ(FREQ) | |
---|---|---|---|---|
견인요소(KEYWORD) | 1.000 | 0.000 | 0.020 | 0.000 |
세부견인요소(KEYWORD_DETAIL) | 0.000 | 1.000 | 0.084 | 0.000 |
행정구(GU_NM) | 0.020 | 0.084 | 1.000 | 0.000 |
FREQ(FREQ) | 0.000 | 0.000 | 0.000 | 1.000 |
DOC_DATE(DATE) | 행정구(GU_NM) | 세부견인요소(KEYWORD_DETAIL) | 견인요소(KEYWORD) | FREQ(FREQ) | |
---|---|---|---|---|---|
DOC_DATE(DATE) | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 |
행정구(GU_NM) | 0.000 | 1.000 | 0.084 | 0.020 | 0.000 |
세부견인요소(KEYWORD_DETAIL) | 0.000 | 0.084 | 1.000 | 0.000 | 0.000 |
견인요소(KEYWORD) | 0.000 | 0.020 | 0.000 | 1.000 | 0.000 |
FREQ(FREQ) | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
DOC_DATE(DATE) | 수집소스(SOURCE) | 행정동(DONG_NM) | 행정구(GU_NM) | 세부견인요소(KEYWORD_DETAIL) | 견인요소(KEYWORD) | FREQ(FREQ) | |
---|---|---|---|---|---|---|---|
0 | 20170717 | 블로그 | 을지로 | 종로구 | 화가 | 기타 | 1 |
1 | 20170814 | 블로그 | 서울 | 강남구 | 포스터 | 감성사진 | 1 |
2 | 20190930 | 블로그 | 서울시립미술관 | 중구 | 도슨트 | 건축 | 1 |
3 | 20180608 | 블로그 | 서울 | 강남구 | 예술 | 기타 | 1 |
4 | 20191115 | 블로그 | 서울 | 강남구 | 촬영 | 예술성 | 1 |
5 | 20181201 | 블로그 | 한강 | 서초구 | 예술가 | 예술성 | 1 |
6 | 20170816 | 블로그 | 서울 | 용산구 | 작품 | 예술성 | 1 |
7 | 20191118 | 블로그 | 국립현대미술관 | 종로구 | 인스타그램 | 건축 | 1 |
8 | 20180629 | 블로그 | 올림픽공원 | 서대문구 | 작품 | 기타 | 1 |
9 | 20190310 | 블로그 | 올림픽공원 | 강남구 | 전시장 | 예술성 | 1 |
DOC_DATE(DATE) | 수집소스(SOURCE) | 행정동(DONG_NM) | 행정구(GU_NM) | 세부견인요소(KEYWORD_DETAIL) | 견인요소(KEYWORD) | FREQ(FREQ) | |
---|---|---|---|---|---|---|---|
490 | 20191109 | 블로그 | 한강 | 서울 | 포토존 | 건축 | 1 |
491 | 20190113 | 블로그 | 예술의전당 | 강남구 | 조명 | 예술성 | 1 |
492 | 20180622 | 블로그 | 서울 | 종로구 | 작품 | 건축 | 1 |
493 | 20181023 | 블로그 | 한남동사운즈 | 서초구 | 외관 | 기타 | 1 |
494 | 20170310 | 블로그 | 서울 | 서초구 | 예술 | 감성사진 | 1 |
495 | 20170914 | 블로그 | 버티고개 | 종로구 | 전시장 | 감성사진 | 1 |
496 | 20171221 | 블로그 | 용산 | 중구 | 예술 | 예술성 | 1 |
497 | 20190116 | 블로그 | 압구정로데오 | 강남구 | 비쥬얼 | 기타 | 1 |
498 | 20180726 | 블로그 | 이태원 | 종로구 | 인테리어 | 기타 | 2 |
499 | 20181025 | 블로그 | 이촌역 | 영등포구 | 사진촬영 | 기타 | 1 |