Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 8119 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 333.1 KiB |
Average record size in memory | 42.0 B |
Variable types
Numeric | 2 |
---|---|
DateTime | 1 |
Text | 1 |
Categorical | 1 |
Dataset
Description | 2022년 5월부터 2023년 6월까지 개인정보 On마당 홈페이지에서 검색한 키워드에 대한 데이터로 해당 년,월에 입력 한 키워드와 횟수를 확인 할 수 있습니다. |
---|---|
URL | https://www.data.go.kr/data/15119847/fileData.do |
Reproduction
Analysis started | 2023-12-12 12:07:57.090126 |
---|---|
Analysis finished | 2023-12-12 12:07:58.343023 |
Duration | 1.25 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
번호
Real number (ℝ)
UNIQUE
 
Distinct | 8119 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4060 |
Minimum | 1 |
---|---|
Maximum | 8119 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 71.5 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 406.9 |
Q1 | 2030.5 |
median | 4060 |
Q3 | 6089.5 |
95-th percentile | 7713.1 |
Maximum | 8119 |
Range | 8118 |
Interquartile range (IQR) | 4059 |
Descriptive statistics
Standard deviation | 2343.8978 |
---|---|
Coefficient of variation (CV) | 0.57731472 |
Kurtosis | -1.2 |
Mean | 4060 |
Median Absolute Deviation (MAD) | 2030 |
Skewness | 0 |
Sum | 32963140 |
Variance | 5493856.7 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
5409 | 1 | < 0.1% |
5422 | 1 | < 0.1% |
5421 | 1 | < 0.1% |
5420 | 1 | < 0.1% |
5419 | 1 | < 0.1% |
5418 | 1 | < 0.1% |
5417 | 1 | < 0.1% |
5416 | 1 | < 0.1% |
5415 | 1 | < 0.1% |
Other values (8109) | 8109 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
8119 | 1 | |
8118 | 1 | |
8117 | 1 | |
8116 | 1 | |
8115 | 1 | |
8114 | 1 | |
8113 | 1 | |
8112 | 1 | |
8111 | 1 | |
8110 | 1 |
입력확정일자
Date
Distinct | 14 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 63.6 KiB |
Minimum | 2022-05-01 00:00:00 |
---|---|
Maximum | 2023-06-01 00:00:00 |
키워드
Text
Distinct | 4788 |
---|---|
Distinct (%) | 59.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 63.6 KiB |
Value | Count | Frequency (%) |
개인정보 | 257 | 2.4% |
동의 | 136 | 1.3% |
cctv | 128 | 1.2% |
제공 | 114 | 1.1% |
위탁 | 78 | 0.7% |
수집 | 77 | 0.7% |
파기 | 74 | 0.7% |
직원 | 73 | 0.7% |
정보 | 68 | 0.6% |
제3자 | 61 | 0.6% |
Other values (3285) | 9660 |
Most occurring characters
Value | Count | Frequency (%) |
2720 | 7.9% | |
보 | 1238 | 3.6% |
정 | 1009 | 2.9% |
인 | 983 | 2.9% |
개 | 651 | 1.9% |
자 | 612 | 1.8% |
사 | 576 | 1.7% |
이 | 532 | 1.5% |
기 | 454 | 1.3% |
호 | 447 | 1.3% |
Other values (616) | 25230 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 29547 | |
Space Separator | 2720 | 7.9% |
Lowercase Letter | 1044 | 3.0% |
Uppercase Letter | 646 | 1.9% |
Decimal Number | 454 | 1.3% |
Other Punctuation | 28 | 0.1% |
Dash Punctuation | 8 | < 0.1% |
Close Punctuation | 2 | < 0.1% |
Connector Punctuation | 2 | < 0.1% |
Math Symbol | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
보 | 1238 | 4.2% |
정 | 1009 | 3.4% |
인 | 983 | 3.3% |
개 | 651 | 2.2% |
자 | 612 | 2.1% |
사 | 576 | 1.9% |
이 | 532 | 1.8% |
기 | 454 | 1.5% |
호 | 447 | 1.5% |
공 | 435 | 1.5% |
Other values (547) | 22610 |
Lowercase Letter
Value | Count | Frequency (%) |
c | 219 | |
t | 106 | |
v | 102 | |
s | 94 | |
i | 80 | 7.7% |
a | 70 | 6.7% |
p | 46 | 4.4% |
d | 45 | 4.3% |
o | 37 | 3.5% |
e | 37 | 3.5% |
Other values (16) | 208 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 122 | |
I | 73 | |
S | 67 | |
D | 54 | |
T | 53 | |
V | 52 | |
A | 48 | 7.4% |
P | 43 | 6.7% |
B | 25 | 3.9% |
G | 16 | 2.5% |
Other values (11) | 93 |
Decimal Number
Value | Count | Frequency (%) |
3 | 129 | |
1 | 106 | |
2 | 66 | |
4 | 53 | |
0 | 31 | 6.8% |
8 | 21 | 4.6% |
5 | 19 | 4.2% |
9 | 12 | 2.6% |
7 | 10 | 2.2% |
6 | 7 | 1.5% |
Other Punctuation
Value | Count | Frequency (%) |
, | 13 | |
\ | 5 | 17.9% |
/ | 5 | 17.9% |
. | 2 | 7.1% |
; | 1 | 3.6% |
· | 1 | 3.6% |
: | 1 | 3.6% |
Space Separator
Value | Count | Frequency (%) |
2720 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 8 |
Close Punctuation
Value | Count | Frequency (%) |
] | 2 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 2 |
Math Symbol
Value | Count | Frequency (%) |
+ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 29547 | |
Common | 3215 | 9.3% |
Latin | 1690 | 4.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
보 | 1238 | 4.2% |
정 | 1009 | 3.4% |
인 | 983 | 3.3% |
개 | 651 | 2.2% |
자 | 612 | 2.1% |
사 | 576 | 1.9% |
이 | 532 | 1.8% |
기 | 454 | 1.5% |
호 | 447 | 1.5% |
공 | 435 | 1.5% |
Other values (547) | 22610 |
Latin
Value | Count | Frequency (%) |
c | 219 | 13.0% |
C | 122 | 7.2% |
t | 106 | 6.3% |
v | 102 | 6.0% |
s | 94 | 5.6% |
i | 80 | 4.7% |
I | 73 | 4.3% |
a | 70 | 4.1% |
S | 67 | 4.0% |
D | 54 | 3.2% |
Other values (37) | 703 |
Common
Value | Count | Frequency (%) |
2720 | ||
3 | 129 | 4.0% |
1 | 106 | 3.3% |
2 | 66 | 2.1% |
4 | 53 | 1.6% |
0 | 31 | 1.0% |
8 | 21 | 0.7% |
5 | 19 | 0.6% |
, | 13 | 0.4% |
9 | 12 | 0.4% |
Other values (12) | 45 | 1.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 29507 | |
ASCII | 4904 | 14.2% |
Compat Jamo | 40 | 0.1% |
None | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2720 | ||
c | 219 | 4.5% |
3 | 129 | 2.6% |
C | 122 | 2.5% |
1 | 106 | 2.2% |
t | 106 | 2.2% |
v | 102 | 2.1% |
s | 94 | 1.9% |
i | 80 | 1.6% |
I | 73 | 1.5% |
Other values (58) | 1153 |
Hangul
Value | Count | Frequency (%) |
보 | 1238 | 4.2% |
정 | 1009 | 3.4% |
인 | 983 | 3.3% |
개 | 651 | 2.2% |
자 | 612 | 2.1% |
사 | 576 | 2.0% |
이 | 532 | 1.8% |
기 | 454 | 1.5% |
호 | 447 | 1.5% |
공 | 435 | 1.5% |
Other values (527) | 22570 |
Compat Jamo
Value | Count | Frequency (%) |
ㅍ | 6 | |
ㄱ | 4 | 10.0% |
ㅊ | 3 | 7.5% |
ㅣ | 3 | 7.5% |
ㄴ | 3 | 7.5% |
ㅑ | 2 | 5.0% |
ㅂ | 2 | 5.0% |
ㅕ | 2 | 5.0% |
ㅓ | 2 | 5.0% |
ㅇ | 2 | 5.0% |
Other values (10) | 11 |
None
Value | Count | Frequency (%) |
· | 1 |
검색개수
Real number (ℝ)
Distinct | 87 |
---|---|
Distinct (%) | 1.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4.4392167 |
Minimum | 1 |
---|---|
Maximum | 304 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 71.5 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 2 |
Q3 | 4 |
95-th percentile | 16 |
Maximum | 304 |
Range | 303 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 9.4522031 |
---|---|
Coefficient of variation (CV) | 2.1292502 |
Kurtosis | 188.13809 |
Mean | 4.4392167 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 9.9219943 |
Sum | 36042 |
Variance | 89.344143 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 3897 | |
2 | 1296 | 16.0% |
3 | 657 | 8.1% |
4 | 432 | 5.3% |
5 | 289 | 3.6% |
6 | 224 | 2.8% |
7 | 191 | 2.4% |
8 | 160 | 2.0% |
9 | 111 | 1.4% |
10 | 106 | 1.3% |
Other values (77) | 756 | 9.3% |
Value | Count | Frequency (%) |
1 | 3897 | |
2 | 1296 | 16.0% |
3 | 657 | 8.1% |
4 | 432 | 5.3% |
5 | 289 | 3.6% |
6 | 224 | 2.8% |
7 | 191 | 2.4% |
8 | 160 | 2.0% |
9 | 111 | 1.4% |
10 | 106 | 1.3% |
Value | Count | Frequency (%) |
304 | 1 | |
181 | 1 | |
156 | 1 | |
149 | 1 | |
144 | 1 | |
123 | 2 | |
121 | 1 | |
116 | 1 | |
110 | 1 | |
108 | 1 |
키워드분류
Categorical
IMBALANCE
 
Distinct | 18 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 63.6 KiB |
기타 | |
---|---|
직장 | 473 |
웹사이트 | 351 |
영상 | 176 |
휴대폰 | 161 |
Other values (13) | 517 |
Length
Max length | 7 |
---|---|
Median length | 2 |
Mean length | 2.1704643 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 기타 |
---|---|
2nd row | 기타 |
3rd row | 가명정보 |
4th row | 기타 |
5th row | 기타 |
Common Values
Value | Count | Frequency (%) |
기타 | 6441 | |
직장 | 473 | 5.8% |
웹사이트 | 351 | 4.3% |
영상 | 176 | 2.2% |
휴대폰 | 161 | 2.0% |
금융 | 145 | 1.8% |
녹취 | 89 | 1.1% |
내부시스템 | 63 | 0.8% |
계약 | 37 | 0.5% |
SNS | 31 | 0.4% |
Other values (8) | 152 | 1.9% |
Length
Value | Count | Frequency (%) |
기타 | 6441 | |
직장 | 473 | 5.8% |
웹사이트 | 351 | 4.3% |
영상 | 176 | 2.2% |
휴대폰 | 161 | 2.0% |
금융 | 145 | 1.8% |
녹취 | 89 | 1.1% |
내부시스템 | 63 | 0.8% |
계약 | 37 | 0.5% |
이메일 | 31 | 0.4% |
Other values (8) | 152 | 1.9% |
번호 | 입력확정일자 | 검색개수 | 키워드분류 | |
---|---|---|---|---|
번호 | 1.000 | 0.977 | 0.020 | 0.074 |
입력확정일자 | 0.977 | 1.000 | 0.000 | 0.098 |
검색개수 | 0.020 | 0.000 | 1.000 | 0.132 |
키워드분류 | 0.074 | 0.098 | 0.132 | 1.000 |
번호 | 검색개수 | 키워드분류 | |
---|---|---|---|
번호 | 1.000 | -0.051 | 0.028 |
검색개수 | -0.051 | 1.000 | 0.059 |
키워드분류 | 0.028 | 0.059 | 1.000 |
번호 | 입력확정일자 | 키워드 | 검색개수 | 키워드분류 | |
---|---|---|---|---|---|
0 | 1 | 2022-05-01 | 캔 | 1 | 기타 |
1 | 2 | 2022-05-01 | 콜 | 1 | 기타 |
2 | 3 | 2022-05-01 | 가명 | 1 | 가명정보 |
3 | 4 | 2022-05-01 | 가상 | 2 | 기타 |
4 | 5 | 2022-05-01 | 가족 | 34 | 기타 |
5 | 6 | 2022-05-01 | 간편 | 1 | 기타 |
6 | 7 | 2022-05-01 | 감사 | 25 | 기타 |
7 | 8 | 2022-05-01 | 같은 | 2 | 기타 |
8 | 9 | 2022-05-01 | 개인 | 1 | 기타 |
9 | 10 | 2022-05-01 | 걸음 | 1 | 기타 |
번호 | 입력확정일자 | 키워드 | 검색개수 | 키워드분류 | |
---|---|---|---|---|---|
8109 | 8110 | 2023-06-01 | IDFA ADIA | 1 | 기타 |
8110 | 8111 | 2023-06-01 | IDFA ADIA | 1 | 기타 |
8111 | 8112 | 2023-06-01 | ip | 6 | 기타 |
8112 | 8113 | 2023-06-01 | PG사 | 3 | 기타 |
8113 | 8114 | 2023-06-01 | PG사 | 1 | 기타 |
8114 | 8115 | 2023-06-01 | PG사 재위탁 | 1 | 기타 |
8115 | 8116 | 2023-06-01 | PG사 재위탁 | 1 | 기타 |
8116 | 8117 | 2023-06-01 | SNS | 6 | SNS |
8117 | 8118 | 2023-06-01 | tlrqufwk | 1 | 기타 |
8118 | 8119 | 2023-06-01 | vdi | 1 | 기타 |