Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 30 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.8 KiB |
Average record size in memory | 62.4 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 4 |
Text | 2 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 다음소프트 |
URL | https://bigdata.seoul.go.kr/data/selectSampleData.do?sample_data_seq=57 |
수집소스(SOURCE) has constant value "" | Constant |
행정구(GU_NM) is highly overall correlated with FREQ(FREQ) | High correlation |
FREQ(FREQ) is highly overall correlated with 행정구(GU_NM) | High correlation |
FREQ(FREQ) is highly imbalanced (78.9%) | Imbalance |
DOC_DATE(DATE) has unique values | Unique |
Reproduction
Analysis started | 2023-12-10 14:53:45.673543 |
---|---|
Analysis finished | 2023-12-10 14:53:46.746401 |
Duration | 1.07 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
DOC_DATE(DATE)
Real number (ℝ)
UNIQUE
 
Distinct | 30 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20180633 |
Minimum | 20170426 |
---|---|
Maximum | 20191201 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 402.0 B |
Quantile statistics
Minimum | 20170426 |
---|---|
5-th percentile | 20170510 |
Q1 | 20170843 |
median | 20180564 |
Q3 | 20190319 |
95-th percentile | 20190988 |
Maximum | 20191201 |
Range | 20775 |
Interquartile range (IQR) | 19476.5 |
Descriptive statistics
Standard deviation | 9361.1736 |
---|---|
Coefficient of variation (CV) | 0.00046386918 |
Kurtosis | -1.9605081 |
Mean | 20180633 |
Median Absolute Deviation (MAD) | 9751 |
Skewness | 0.0062111161 |
Sum | 6.0541898 × 108 |
Variance | 87631571 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20170726 | 1 | 3.3% |
20170426 | 1 | 3.3% |
20190102 | 1 | 3.3% |
20171012 | 1 | 3.3% |
20170530 | 1 | 3.3% |
20190302 | 1 | 3.3% |
20170522 | 1 | 3.3% |
20171119 | 1 | 3.3% |
20170624 | 1 | 3.3% |
20190707 | 1 | 3.3% |
Other values (20) | 20 |
Value | Count | Frequency (%) |
20170426 | 1 | |
20170501 | 1 | |
20170522 | 1 | |
20170530 | 1 | |
20170624 | 1 | |
20170719 | 1 | |
20170726 | 1 | |
20170823 | 1 | |
20170902 | 1 | |
20171012 | 1 |
Value | Count | Frequency (%) |
20191201 | 1 | |
20191125 | 1 | |
20190820 | 1 | |
20190728 | 1 | |
20190707 | 1 | |
20190511 | 1 | |
20190423 | 1 | |
20190323 | 1 | |
20190308 | 1 | |
20190302 | 1 |
수집소스(SOURCE)
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 3.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
블로그 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 블로그 |
---|---|
2nd row | 블로그 |
3rd row | 블로그 |
4th row | 블로그 |
5th row | 블로그 |
Common Values
Value | Count | Frequency (%) |
블로그 | 30 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
블로그 | 30 |
행정동(DONG_NM)
Text
Distinct | 21 |
---|---|
Distinct (%) | 70.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
Value | Count | Frequency (%) |
서울 | 4 | 13.3% |
용산 | 3 | 10.0% |
상봉 | 2 | 6.7% |
강남 | 2 | 6.7% |
연남동 | 2 | 6.7% |
코엑스 | 2 | 6.7% |
용산cgv | 1 | 3.3% |
망원동 | 1 | 3.3% |
왕십리cgv | 1 | 3.3% |
대학로 | 1 | 3.3% |
Other values (11) | 11 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 6 | 6.1% |
남 | 5 | 5.1% |
서 | 4 | 4.0% |
용 | 4 | 4.0% |
산 | 4 | 4.0% |
울 | 4 | 4.0% |
강 | 3 | 3.0% |
v | 3 | 3.0% |
g | 3 | 3.0% |
c | 3 | 3.0% |
Other values (47) | 60 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 90 | |
Lowercase Letter | 9 | 9.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 6 | 6.7% |
남 | 5 | 5.6% |
서 | 4 | 4.4% |
용 | 4 | 4.4% |
산 | 4 | 4.4% |
울 | 4 | 4.4% |
강 | 3 | 3.3% |
스 | 3 | 3.3% |
영 | 2 | 2.2% |
자 | 2 | 2.2% |
Other values (44) | 53 |
Lowercase Letter
Value | Count | Frequency (%) |
v | 3 | |
g | 3 | |
c | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 90 | |
Latin | 9 | 9.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 6 | 6.7% |
남 | 5 | 5.6% |
서 | 4 | 4.4% |
용 | 4 | 4.4% |
산 | 4 | 4.4% |
울 | 4 | 4.4% |
강 | 3 | 3.3% |
스 | 3 | 3.3% |
영 | 2 | 2.2% |
자 | 2 | 2.2% |
Other values (44) | 53 |
Latin
Value | Count | Frequency (%) |
v | 3 | |
g | 3 | |
c | 3 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 90 | |
ASCII | 9 | 9.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 6 | 6.7% |
남 | 5 | 5.6% |
서 | 4 | 4.4% |
용 | 4 | 4.4% |
산 | 4 | 4.4% |
울 | 4 | 4.4% |
강 | 3 | 3.3% |
스 | 3 | 3.3% |
영 | 2 | 2.2% |
자 | 2 | 2.2% |
Other values (44) | 53 |
ASCII
Value | Count | Frequency (%) |
v | 3 | |
g | 3 | |
c | 3 |
행정구(GU_NM)
Categorical
HIGH CORRELATION
 
Distinct | 14 |
---|---|
Distinct (%) | 46.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
용산구 | |
---|---|
서울 | |
강남구 | |
영등포구 | |
중구 | |
Other values (9) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 2.9333333 |
Min length | 2 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 13.3% |
Sample
1st row | 동대문구 |
---|---|
2nd row | 영등포구 |
3rd row | 용산구 |
4th row | 용산구 |
5th row | 중구 |
Common Values
Value | Count | Frequency (%) |
용산구 | 5 | |
서울 | 4 | |
강남구 | 3 | |
영등포구 | 2 | 6.7% |
중구 | 2 | 6.7% |
마포구 | 2 | 6.7% |
종로구 | 2 | 6.7% |
광진구 | 2 | 6.7% |
성동구 | 2 | 6.7% |
구로구 | 2 | 6.7% |
Other values (4) | 4 |
Length
Value | Count | Frequency (%) |
용산구 | 5 | |
서울 | 4 | |
강남구 | 3 | |
영등포구 | 2 | 6.7% |
중구 | 2 | 6.7% |
마포구 | 2 | 6.7% |
종로구 | 2 | 6.7% |
광진구 | 2 | 6.7% |
성동구 | 2 | 6.7% |
구로구 | 2 | 6.7% |
Other values (4) | 4 |
Distinct | 17 |
---|---|
Distinct (%) | 56.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
Value | Count | Frequency (%) |
팝콘 | 4 | |
콤보 | 3 | |
시설 | 3 | |
행사 | 3 | |
무대인사 | 2 | 6.7% |
화면 | 2 | 6.7% |
매점 | 2 | 6.7% |
시사회 | 2 | 6.7% |
인디 | 1 | 3.3% |
포스터 | 1 | 3.3% |
Other values (7) | 7 |
Most occurring characters
Value | Count | Frequency (%) |
사 | 7 | 9.2% |
시 | 6 | 7.9% |
팝 | 4 | 5.3% |
콘 | 4 | 5.3% |
행 | 3 | 3.9% |
콤 | 3 | 3.9% |
보 | 3 | 3.9% |
설 | 3 | 3.9% |
인 | 3 | 3.9% |
화 | 3 | 3.9% |
Other values (29) | 37 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 74 | |
Decimal Number | 1 | 1.3% |
Lowercase Letter | 1 | 1.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
사 | 7 | 9.5% |
시 | 6 | 8.1% |
팝 | 4 | 5.4% |
콘 | 4 | 5.4% |
행 | 3 | 4.1% |
콤 | 3 | 4.1% |
보 | 3 | 4.1% |
설 | 3 | 4.1% |
인 | 3 | 4.1% |
화 | 3 | 4.1% |
Other values (27) | 35 |
Decimal Number
Value | Count | Frequency (%) |
3 | 1 |
Lowercase Letter
Value | Count | Frequency (%) |
d | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 74 | |
Common | 1 | 1.3% |
Latin | 1 | 1.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
사 | 7 | 9.5% |
시 | 6 | 8.1% |
팝 | 4 | 5.4% |
콘 | 4 | 5.4% |
행 | 3 | 4.1% |
콤 | 3 | 4.1% |
보 | 3 | 4.1% |
설 | 3 | 4.1% |
인 | 3 | 4.1% |
화 | 3 | 4.1% |
Other values (27) | 35 |
Common
Value | Count | Frequency (%) |
3 | 1 |
Latin
Value | Count | Frequency (%) |
d | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 74 | |
ASCII | 2 | 2.6% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
사 | 7 | 9.5% |
시 | 6 | 8.1% |
팝 | 4 | 5.4% |
콘 | 4 | 5.4% |
행 | 3 | 4.1% |
콤 | 3 | 4.1% |
보 | 3 | 4.1% |
설 | 3 | 4.1% |
인 | 3 | 4.1% |
화 | 3 | 4.1% |
Other values (27) | 35 |
ASCII
Value | Count | Frequency (%) |
3 | 1 | |
d | 1 |
견인요소(KEYWORD)
Categorical
Distinct | 3 |
---|---|
Distinct (%) | 10.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
취향 | |
---|---|
먹거리 | |
관람환경 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.6666667 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 취향 |
---|---|
2nd row | 먹거리 |
3rd row | 먹거리 |
4th row | 관람환경 |
5th row | 먹거리 |
Common Values
Value | Count | Frequency (%) |
취향 | 16 | |
먹거리 | 8 | |
관람환경 | 6 | 20.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
취향 | 16 | |
먹거리 | 8 | |
관람환경 | 6 | 20.0% |
FREQ(FREQ)
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 6.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
1 | |
---|---|
2 | 1 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 3.3% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 29 | |
2 | 1 | 3.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 29 | |
2 | 1 | 3.3% |
DOC_DATE(DATE) | 행정동(DONG_NM) | 행정구(GU_NM) | 세부견인요소(KEYWORD_DETAIL) | 견인요소(KEYWORD) | FREQ(FREQ) | |
---|---|---|---|---|---|---|
DOC_DATE(DATE) | 1.000 | 0.973 | 0.000 | 0.000 | 0.000 | 0.000 |
행정동(DONG_NM) | 0.973 | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 |
행정구(GU_NM) | 0.000 | 0.000 | 1.000 | 0.332 | 0.350 | 1.000 |
세부견인요소(KEYWORD_DETAIL) | 0.000 | 0.000 | 0.332 | 1.000 | 0.443 | 0.000 |
견인요소(KEYWORD) | 0.000 | 0.000 | 0.350 | 0.443 | 1.000 | 0.000 |
FREQ(FREQ) | 0.000 | 0.000 | 1.000 | 0.000 | 0.000 | 1.000 |
견인요소(KEYWORD) | 행정구(GU_NM) | FREQ(FREQ) | |
---|---|---|---|
견인요소(KEYWORD) | 1.000 | 0.101 | 0.000 |
행정구(GU_NM) | 0.101 | 1.000 | 0.756 |
FREQ(FREQ) | 0.000 | 0.756 | 1.000 |
DOC_DATE(DATE) | 행정구(GU_NM) | 견인요소(KEYWORD) | FREQ(FREQ) | |
---|---|---|---|---|
DOC_DATE(DATE) | 1.000 | 0.000 | 0.000 | 0.000 |
행정구(GU_NM) | 0.000 | 1.000 | 0.101 | 0.756 |
견인요소(KEYWORD) | 0.000 | 0.101 | 1.000 | 0.000 |
FREQ(FREQ) | 0.000 | 0.756 | 0.000 | 1.000 |
DOC_DATE(DATE) | 수집소스(SOURCE) | 행정동(DONG_NM) | 행정구(GU_NM) | 세부견인요소(KEYWORD_DETAIL) | 견인요소(KEYWORD) | FREQ(FREQ) | |
---|---|---|---|---|---|---|---|
0 | 20170726 | 블로그 | 상봉 | 동대문구 | 팝콘 | 취향 | 1 |
1 | 20190820 | 블로그 | 용산 | 영등포구 | 콤보 | 먹거리 | 1 |
2 | 20180223 | 블로그 | 청계천 | 용산구 | 무대인사 | 먹거리 | 1 |
3 | 20190308 | 블로그 | 서울 | 용산구 | 관크 | 관람환경 | 1 |
4 | 20170501 | 블로그 | 서울 | 중구 | 화면 | 먹거리 | 1 |
5 | 20170902 | 블로그 | 상봉 | 마포구 | 시야 | 관람환경 | 1 |
6 | 20180801 | 블로그 | 강남역 | 마포구 | 매점 | 먹거리 | 1 |
7 | 20170823 | 블로그 | 잠실새내 | 강남구 | 행사 | 취향 | 1 |
8 | 20191201 | 블로그 | 국회의사당 | 종로구 | 3d | 먹거리 | 1 |
9 | 20180517 | 블로그 | 영등포동 | 강남구 | 팬덤 | 취향 | 1 |
DOC_DATE(DATE) | 수집소스(SOURCE) | 행정동(DONG_NM) | 행정구(GU_NM) | 세부견인요소(KEYWORD_DETAIL) | 견인요소(KEYWORD) | FREQ(FREQ) | |
---|---|---|---|---|---|---|---|
20 | 20171016 | 블로그 | 용산cgv | 구로구 | 팝콘 | 취향 | 1 |
21 | 20190423 | 블로그 | 동대문디자인플라자 | 용산구 | 행사 | 취향 | 1 |
22 | 20190707 | 블로그 | 연남동 | 용산구 | 다큐멘터리영화 | 관람환경 | 1 |
23 | 20170624 | 블로그 | 대학로 | 서울 | 시사회 | 취향 | 1 |
24 | 20171119 | 블로그 | 코엑스 | 서울 | 포스터 | 먹거리 | 1 |
25 | 20170522 | 블로그 | 연남동 | 성동구 | 인디 | 먹거리 | 1 |
26 | 20190302 | 블로그 | 왕십리cgv | 송파구 | 매점 | 취향 | 1 |
27 | 20170530 | 블로그 | 망원동 | 구로구 | 시설 | 관람환경 | 1 |
28 | 20171012 | 블로그 | 서울 | 광진구 | 콤보 | 취향 | 1 |
29 | 20190102 | 블로그 | 신촌 | 서울 | 세트메뉴 | 취향 | 1 |