Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 5.0 KiB |
Average record size in memory | 51.3 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 3 |
Text | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 다음소프트 |
URL | https://bigdata.seoul.go.kr/data/selectSampleData.do?sample_data_seq=57 |
수집소스(SOURCE) is highly overall correlated with 행정구(GU_NM) | High correlation |
행정구(GU_NM) is highly overall correlated with 수집소스(SOURCE) | High correlation |
수집소스(SOURCE) is highly imbalanced (85.9%) | Imbalance |
Reproduction
Analysis started | 2023-12-10 14:54:00.539845 |
---|---|
Analysis finished | 2023-12-10 14:54:02.222632 |
Duration | 1.68 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
DOC_DATE(DATE)
Real number (ℝ)
Distinct | 94 |
---|---|
Distinct (%) | 94.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20180248 |
Minimum | 20170101 |
---|---|
Maximum | 20191231 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 20170101 |
---|---|
5-th percentile | 20170206 |
Q1 | 20170927 |
median | 20180621 |
Q3 | 20190148 |
95-th percentile | 20191021 |
Maximum | 20191231 |
Range | 21130 |
Interquartile range (IQR) | 19220.75 |
Descriptive statistics
Standard deviation | 7771.832 |
---|---|
Coefficient of variation (CV) | 0.00038512074 |
Kurtosis | -1.328081 |
Mean | 20180248 |
Median Absolute Deviation (MAD) | 9599 |
Skewness | 0.060382441 |
Sum | 2.0180248 × 109 |
Variance | 60401372 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20190318 | 2 | 2.0% |
20170927 | 2 | 2.0% |
20191217 | 2 | 2.0% |
20190816 | 2 | 2.0% |
20180220 | 2 | 2.0% |
20181204 | 2 | 2.0% |
20180609 | 1 | 1.0% |
20190526 | 1 | 1.0% |
20181221 | 1 | 1.0% |
20181120 | 1 | 1.0% |
Other values (84) | 84 |
Value | Count | Frequency (%) |
20170101 | 1 | |
20170113 | 1 | |
20170116 | 1 | |
20170118 | 1 | |
20170204 | 1 | |
20170206 | 1 | |
20170214 | 1 | |
20170226 | 1 | |
20170315 | 1 | |
20170320 | 1 |
Value | Count | Frequency (%) |
20191231 | 1 | |
20191221 | 1 | |
20191217 | 2 | |
20191124 | 1 | |
20191016 | 1 | |
20190906 | 1 | |
20190903 | 1 | |
20190820 | 1 | |
20190816 | 2 | |
20190731 | 1 |
수집소스(SOURCE)
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
블로그커뮤니티 | |
---|---|
트위터 | 2 |
Length
Max length | 7 |
---|---|
Median length | 7 |
Mean length | 6.92 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 블로그커뮤니티 |
---|---|
2nd row | 블로그커뮤니티 |
3rd row | 블로그커뮤니티 |
4th row | 트위터 |
5th row | 블로그커뮤니티 |
Common Values
Value | Count | Frequency (%) |
블로그커뮤니티 | 98 | |
트위터 | 2 | 2.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
블로그커뮤니티 | 98 | |
트위터 | 2 | 2.0% |
행정동(DONG_NM)
Text
Distinct | 61 |
---|---|
Distinct (%) | 61.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
서울 | 6 | 6.0% |
서울시립미술관 | 5 | 5.0% |
용산 | 5 | 5.0% |
한가람미술관 | 4 | 4.0% |
경복궁 | 3 | 3.0% |
동대문디자인플라자 | 3 | 3.0% |
국립현대미술관 | 3 | 3.0% |
예술의전당 | 3 | 3.0% |
광화문 | 3 | 3.0% |
국립중앙박물관 | 3 | 3.0% |
Other values (51) | 62 |
Most occurring characters
Value | Count | Frequency (%) |
관 | 23 | 5.9% |
동 | 19 | 4.9% |
술 | 18 | 4.6% |
서 | 15 | 3.9% |
미 | 15 | 3.9% |
울 | 14 | 3.6% |
립 | 13 | 3.3% |
대 | 10 | 2.6% |
문 | 9 | 2.3% |
국 | 8 | 2.1% |
Other values (91) | 245 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 387 | |
Lowercase Letter | 2 | 0.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
관 | 23 | 5.9% |
동 | 19 | 4.9% |
술 | 18 | 4.7% |
서 | 15 | 3.9% |
미 | 15 | 3.9% |
울 | 14 | 3.6% |
립 | 13 | 3.4% |
대 | 10 | 2.6% |
문 | 9 | 2.3% |
국 | 8 | 2.1% |
Other values (89) | 243 |
Lowercase Letter
Value | Count | Frequency (%) |
d | 1 | |
k | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 387 | |
Latin | 2 | 0.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
관 | 23 | 5.9% |
동 | 19 | 4.9% |
술 | 18 | 4.7% |
서 | 15 | 3.9% |
미 | 15 | 3.9% |
울 | 14 | 3.6% |
립 | 13 | 3.4% |
대 | 10 | 2.6% |
문 | 9 | 2.3% |
국 | 8 | 2.1% |
Other values (89) | 243 |
Latin
Value | Count | Frequency (%) |
d | 1 | |
k | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 387 | |
ASCII | 2 | 0.5% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
관 | 23 | 5.9% |
동 | 19 | 4.9% |
술 | 18 | 4.7% |
서 | 15 | 3.9% |
미 | 15 | 3.9% |
울 | 14 | 3.6% |
립 | 13 | 3.4% |
대 | 10 | 2.6% |
문 | 9 | 2.3% |
국 | 8 | 2.1% |
Other values (89) | 243 |
ASCII
Value | Count | Frequency (%) |
d | 1 | |
k | 1 |
행정구(GU_NM)
Categorical
HIGH CORRELATION
 
Distinct | 17 |
---|---|
Distinct (%) | 17.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
종로구 | |
---|---|
서초구 | |
용산구 | |
서울 | |
마포구 | |
Other values (12) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 2.93 |
Min length | 2 |
Unique
Unique | 5 ? |
---|---|
Unique (%) | 5.0% |
Sample
1st row | 종로구 |
---|---|
2nd row | 종로구 |
3rd row | 중구 |
4th row | 금천구 |
5th row | 종로구 |
Common Values
Value | Count | Frequency (%) |
종로구 | 37 | |
서초구 | 13 | 13.0% |
용산구 | 12 | 12.0% |
서울 | 7 | 7.0% |
마포구 | 5 | 5.0% |
강남구 | 4 | 4.0% |
중구 | 4 | 4.0% |
영등포구 | 3 | 3.0% |
동작구 | 3 | 3.0% |
송파구 | 3 | 3.0% |
Other values (7) | 9 | 9.0% |
Length
Value | Count | Frequency (%) |
종로구 | 37 | |
서초구 | 13 | 13.0% |
용산구 | 12 | 12.0% |
서울 | 7 | 7.0% |
마포구 | 5 | 5.0% |
강남구 | 4 | 4.0% |
중구 | 4 | 4.0% |
송파구 | 3 | 3.0% |
동작구 | 3 | 3.0% |
영등포구 | 3 | 3.0% |
Other values (7) | 9 | 9.0% |
세부키워드(KEYWORD_DETAIL)
Categorical
Distinct | 15 |
---|---|
Distinct (%) | 15.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
전시 | |
---|---|
전시회 | |
개인전 | 4 |
예술품 | 3 |
명화 | 3 |
Other values (10) |
Length
Max length | 5 |
---|---|
Median length | 2 |
Mean length | 2.57 |
Min length | 2 |
Unique
Unique | 6 ? |
---|---|
Unique (%) | 6.0% |
Sample
1st row | 전시 |
---|---|
2nd row | 전시 |
3rd row | 예술품 |
4th row | 전시회 |
5th row | 전시 |
Common Values
Value | Count | Frequency (%) |
전시 | 48 | |
전시회 | 28 | |
개인전 | 4 | 4.0% |
예술품 | 3 | 3.0% |
명화 | 3 | 3.0% |
전시공간 | 2 | 2.0% |
사진전 | 2 | 2.0% |
ddp전시 | 2 | 2.0% |
도슨트 | 2 | 2.0% |
뒤샹전 | 1 | 1.0% |
Other values (5) | 5 | 5.0% |
Length
Value | Count | Frequency (%) |
전시 | 48 | |
전시회 | 28 | |
개인전 | 4 | 4.0% |
예술품 | 3 | 3.0% |
명화 | 3 | 3.0% |
전시공간 | 2 | 2.0% |
사진전 | 2 | 2.0% |
ddp전시 | 2 | 2.0% |
도슨트 | 2 | 2.0% |
뒤샹전 | 1 | 1.0% |
Other values (5) | 5 | 5.0% |
FREQ(FREQ)
Real number (ℝ)
Distinct | 6 |
---|---|
Distinct (%) | 6.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.37 |
Minimum | 1 |
---|---|
Maximum | 9 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 1 |
95-th percentile | 3 |
Maximum | 9 |
Range | 8 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 1.2685393 |
---|---|
Coefficient of variation (CV) | 0.92594108 |
Kurtosis | 26.017572 |
Mean | 1.37 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 4.8730352 |
Sum | 137 |
Variance | 1.6091919 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 85 | |
2 | 8 | 8.0% |
3 | 3 | 3.0% |
9 | 2 | 2.0% |
4 | 1 | 1.0% |
5 | 1 | 1.0% |
Value | Count | Frequency (%) |
1 | 85 | |
2 | 8 | 8.0% |
3 | 3 | 3.0% |
4 | 1 | 1.0% |
5 | 1 | 1.0% |
9 | 2 | 2.0% |
Value | Count | Frequency (%) |
9 | 2 | 2.0% |
5 | 1 | 1.0% |
4 | 1 | 1.0% |
3 | 3 | 3.0% |
2 | 8 | 8.0% |
1 | 85 |
DOC_DATE(DATE) | 수집소스(SOURCE) | 행정동(DONG_NM) | 행정구(GU_NM) | 세부키워드(KEYWORD_DETAIL) | FREQ(FREQ) | |
---|---|---|---|---|---|---|
DOC_DATE(DATE) | 1.000 | 0.187 | 0.470 | 0.000 | 0.000 | 0.121 |
수집소스(SOURCE) | 0.187 | 1.000 | 0.000 | 0.774 | 0.000 | 0.000 |
행정동(DONG_NM) | 0.470 | 0.000 | 1.000 | 0.000 | 0.615 | 0.000 |
행정구(GU_NM) | 0.000 | 0.774 | 0.000 | 1.000 | 0.234 | 0.000 |
세부키워드(KEYWORD_DETAIL) | 0.000 | 0.000 | 0.615 | 0.234 | 1.000 | 0.000 |
FREQ(FREQ) | 0.121 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
세부키워드(KEYWORD_DETAIL) | 수집소스(SOURCE) | 행정구(GU_NM) | |
---|---|---|---|
세부키워드(KEYWORD_DETAIL) | 1.000 | 0.000 | 0.066 |
수집소스(SOURCE) | 0.000 | 1.000 | 0.659 |
행정구(GU_NM) | 0.066 | 0.659 | 1.000 |
DOC_DATE(DATE) | FREQ(FREQ) | 수집소스(SOURCE) | 행정구(GU_NM) | 세부키워드(KEYWORD_DETAIL) | |
---|---|---|---|---|---|
DOC_DATE(DATE) | 1.000 | -0.013 | 0.115 | 0.000 | 0.000 |
FREQ(FREQ) | -0.013 | 1.000 | 0.000 | 0.000 | 0.000 |
수집소스(SOURCE) | 0.115 | 0.000 | 1.000 | 0.659 | 0.000 |
행정구(GU_NM) | 0.000 | 0.000 | 0.659 | 1.000 | 0.066 |
세부키워드(KEYWORD_DETAIL) | 0.000 | 0.000 | 0.000 | 0.066 | 1.000 |
DOC_DATE(DATE) | 수집소스(SOURCE) | 행정동(DONG_NM) | 행정구(GU_NM) | 세부키워드(KEYWORD_DETAIL) | FREQ(FREQ) | |
---|---|---|---|---|---|---|
0 | 20180609 | 블로그커뮤니티 | 광화문 | 종로구 | 전시 | 1 |
1 | 20180823 | 블로그커뮤니티 | k현대미술관 | 종로구 | 전시 | 1 |
2 | 20190410 | 블로그커뮤니티 | 서울 | 중구 | 예술품 | 1 |
3 | 20170927 | 트위터 | 서울 | 금천구 | 전시회 | 1 |
4 | 20190903 | 블로그커뮤니티 | 강남 | 종로구 | 전시 | 1 |
5 | 20190219 | 블로그커뮤니티 | 북촌 | 종로구 | 전시 | 1 |
6 | 20180109 | 블로그커뮤니티 | 뚝섬유원지 | 광진구 | 전시회 | 1 |
7 | 20190416 | 블로그커뮤니티 | 국립중앙박물관 | 용산구 | 전시 | 1 |
8 | 20170214 | 블로그커뮤니티 | d타워 | 서초구 | 전시 | 1 |
9 | 20180913 | 블로그커뮤니티 | 평창동 | 중구 | 전시회 | 1 |
DOC_DATE(DATE) | 수집소스(SOURCE) | 행정동(DONG_NM) | 행정구(GU_NM) | 세부키워드(KEYWORD_DETAIL) | FREQ(FREQ) | |
---|---|---|---|---|---|---|
90 | 20180802 | 블로그커뮤니티 | 서초 | 마포구 | 전시 | 1 |
91 | 20180523 | 블로그커뮤니티 | 이태원 | 서울 | 전시 | 1 |
92 | 20180701 | 블로그커뮤니티 | 청계천 | 종로구 | 전시 | 1 |
93 | 20171021 | 블로그커뮤니티 | 용산구 | 용산구 | 현대미술 | 1 |
94 | 20170514 | 블로그커뮤니티 | 어린이미술관 | 서초구 | 전시 | 1 |
95 | 20180304 | 블로그커뮤니티 | 서울미술관 | 송파구 | 전시 | 1 |
96 | 20181204 | 블로그커뮤니티 | 신촌 | 강남구 | 전시회 | 1 |
97 | 20181102 | 블로그커뮤니티 | 한강 | 용산구 | 전시 | 9 |
98 | 20190820 | 블로그커뮤니티 | 익선동 | 서초구 | 전시회 | 1 |
99 | 20180328 | 블로그커뮤니티 | 동대문역사문화공원 | 종로구 | 미술품 | 1 |