Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 150 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 3.8 KiB |
Average record size in memory | 25.9 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 1 |
Text | 1 |
Dataset
Description | 디클 플랫폼에서 사용자의 해시태그 검색 기록에 대한 정보로 번호, 검색 분류(카테고리), 검색 해시태그에 대한 정보를 제공합니다. |
---|---|
Author | 한국양성평등교육진흥원 |
URL | https://www.data.go.kr/data/15126163/fileData.do |
Reproduction
Analysis started | 2024-04-29 23:13:01.044445 |
---|---|
Analysis finished | 2024-04-29 23:13:02.843155 |
Duration | 1.8 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 150 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 75.5 |
Minimum | 1 |
---|---|
Maximum | 150 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.4 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 8.45 |
Q1 | 38.25 |
median | 75.5 |
Q3 | 112.75 |
95-th percentile | 142.55 |
Maximum | 150 |
Range | 149 |
Interquartile range (IQR) | 74.5 |
Descriptive statistics
Standard deviation | 43.445368 |
---|---|
Coefficient of variation (CV) | 0.57543534 |
Kurtosis | -1.2 |
Mean | 75.5 |
Median Absolute Deviation (MAD) | 37.5 |
Skewness | 0 |
Sum | 11325 |
Variance | 1887.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.7% |
96 | 1 | 0.7% |
98 | 1 | 0.7% |
99 | 1 | 0.7% |
100 | 1 | 0.7% |
101 | 1 | 0.7% |
102 | 1 | 0.7% |
103 | 1 | 0.7% |
104 | 1 | 0.7% |
105 | 1 | 0.7% |
Other values (140) | 140 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
150 | 1 | |
149 | 1 | |
148 | 1 | |
147 | 1 | |
146 | 1 | |
145 | 1 | |
144 | 1 | |
143 | 1 | |
142 | 1 | |
141 | 1 |
분류
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 3.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.3 KiB |
교사·양육자 | |
---|---|
클립영상 | |
7-12세 | |
16-18세 | |
13-15세 |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 5.3866667 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 7-12세 |
---|---|
2nd row | 7-12세 |
3rd row | 7-12세 |
4th row | 7-12세 |
5th row | 7-12세 |
Common Values
Value | Count | Frequency (%) |
교사·양육자 | 31 | |
클립영상 | 31 | |
7-12세 | 30 | |
16-18세 | 30 | |
13-15세 | 28 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
교사·양육자 | 31 | |
클립영상 | 31 | |
7-12세 | 30 | |
16-18세 | 30 | |
13-15세 | 28 |
해시태그
Text
Distinct | 68 |
---|---|
Distinct (%) | 45.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.3 KiB |
Value | Count | Frequency (%) |
메타버스 | 5 | 3.3% |
온라인그루밍 | 5 | 3.3% |
불법촬영 | 5 | 3.3% |
웹드라마 | 4 | 2.6% |
온라인스토킹 | 4 | 2.6% |
이달의콘텐츠 | 4 | 2.6% |
다큐멘터리 | 4 | 2.6% |
고민상담 | 4 | 2.6% |
개인정보보호 | 4 | 2.6% |
피해지원기관 | 4 | 2.6% |
Other values (59) | 109 |
Most occurring characters
Value | Count | Frequency (%) |
인 | 24 | 3.3% |
이 | 21 | 2.9% |
라 | 20 | 2.8% |
성 | 19 | 2.6% |
법 | 17 | 2.4% |
온 | 15 | 2.1% |
지 | 14 | 2.0% |
사 | 12 | 1.7% |
스 | 12 | 1.7% |
보 | 12 | 1.7% |
Other values (162) | 551 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 702 | |
Lowercase Letter | 6 | 0.8% |
Uppercase Letter | 4 | 0.6% |
Decimal Number | 3 | 0.4% |
Space Separator | 2 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
인 | 24 | 3.4% |
이 | 21 | 3.0% |
라 | 20 | 2.8% |
성 | 19 | 2.7% |
법 | 17 | 2.4% |
온 | 15 | 2.1% |
지 | 14 | 2.0% |
사 | 12 | 1.7% |
스 | 12 | 1.7% |
보 | 12 | 1.7% |
Other values (157) | 536 |
Uppercase Letter
Value | Count | Frequency (%) |
Q | 2 | |
A | 2 |
Lowercase Letter
Value | Count | Frequency (%) |
n | 6 |
Decimal Number
Value | Count | Frequency (%) |
2 | 3 |
Space Separator
Value | Count | Frequency (%) |
2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 702 | |
Latin | 10 | 1.4% |
Common | 5 | 0.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
인 | 24 | 3.4% |
이 | 21 | 3.0% |
라 | 20 | 2.8% |
성 | 19 | 2.7% |
법 | 17 | 2.4% |
온 | 15 | 2.1% |
지 | 14 | 2.0% |
사 | 12 | 1.7% |
스 | 12 | 1.7% |
보 | 12 | 1.7% |
Other values (157) | 536 |
Latin
Value | Count | Frequency (%) |
n | 6 | |
Q | 2 | 20.0% |
A | 2 | 20.0% |
Common
Value | Count | Frequency (%) |
2 | 3 | |
2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 702 | |
ASCII | 15 | 2.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
인 | 24 | 3.4% |
이 | 21 | 3.0% |
라 | 20 | 2.8% |
성 | 19 | 2.7% |
법 | 17 | 2.4% |
온 | 15 | 2.1% |
지 | 14 | 2.0% |
사 | 12 | 1.7% |
스 | 12 | 1.7% |
보 | 12 | 1.7% |
Other values (157) | 536 |
ASCII
Value | Count | Frequency (%) |
n | 6 | |
2 | 3 | |
2 | 13.3% | |
Q | 2 | 13.3% |
A | 2 | 13.3% |
번호 | 분류 | 해시태그 | |
---|---|---|---|
번호 | 1.000 | 0.999 | 0.000 |
분류 | 0.999 | 1.000 | 0.000 |
해시태그 | 0.000 | 0.000 | 1.000 |
번호 | 분류 | |
---|---|---|
번호 | 1.000 | 0.943 |
분류 | 0.943 | 1.000 |
번호 | 분류 | 해시태그 | |
---|---|---|---|
0 | 1 | 7-12세 | 메타버스 |
1 | 2 | 7-12세 | 개인정보보호 |
2 | 3 | 7-12세 | 온라인그루밍 |
3 | 4 | 7-12세 | 온라인채팅 |
4 | 5 | 7-12세 | 프로파일러권일용 |
5 | 6 | 7-12세 | 게임 |
6 | 7 | 7-12세 | 이달의콘텐츠 |
7 | 8 | 7-12세 | 애니메이션 |
8 | 9 | 7-12세 | 오픈채팅 |
9 | 10 | 7-12세 | 불법촬영 |
번호 | 분류 | 해시태그 | |
---|---|---|---|
140 | 141 | 클립영상 | n번방사건 |
141 | 142 | 클립영상 | 디지털성범죄 |
142 | 143 | 클립영상 | 사이버언어폭력 |
143 | 144 | 클립영상 | 정책제안 |
144 | 145 | 클립영상 | 토론 |
145 | 146 | 클립영상 | 다큐멘터리 |
146 | 147 | 클립영상 | 디지털네이티브 |
147 | 148 | 클립영상 | 실험 |
148 | 149 | 클립영상 | 사이버 성적괴롭힘 |
149 | 150 | 클립영상 | 온라인 그루밍 |