Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 1240 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 30.4 KiB |
Average record size in memory | 25.1 B |
Variable types
Text | 1 |
---|---|
Categorical | 1 |
Numeric | 1 |
Dataset
Description | 2022년 서울경찰청 관할 31개 경찰서별 살인 · 폭력 죄종 피해자 성별 · 연령대별 발생 건수로 구분(경찰서별 살인, 폭력), 연령(남.여 자6세이하 부터 남.여 미상까지) 을 파악한현황 입니다. |
---|---|
Author | 경찰청 서울특별시경찰청 |
URL | https://www.data.go.kr/data/3075830/fileData.do |
피해자 수 has 602 (48.5%) zeros | Zeros |
Reproduction
Analysis started | 2024-03-14 16:31:46.225033 |
---|---|
Analysis finished | 2024-03-14 16:31:48.497321 |
Duration | 2.27 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
구분
Text
Distinct | 62 |
---|---|
Distinct (%) | 5.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.8 KiB |
Value | Count | Frequency (%) |
살인 | 620 | |
폭력 | 620 | |
종암 | 40 | 1.6% |
중랑 | 40 | 1.6% |
수서 | 40 | 1.6% |
강남 | 40 | 1.6% |
관악 | 40 | 1.6% |
강서 | 40 | 1.6% |
강동 | 40 | 1.6% |
중부 | 40 | 1.6% |
Other values (23) | 920 |
Most occurring characters
Value | Count | Frequency (%) |
1240 | ||
살 | 620 | 9.7% |
인 | 620 | 9.7% |
폭 | 620 | 9.7% |
력 | 620 | 9.7% |
서 | 200 | 3.1% |
동 | 160 | 2.5% |
강 | 160 | 2.5% |
대 | 120 | 1.9% |
문 | 120 | 1.9% |
Other values (38) | 1880 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 5120 | |
Space Separator | 1240 | 19.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
살 | 620 | 12.1% |
인 | 620 | 12.1% |
폭 | 620 | 12.1% |
력 | 620 | 12.1% |
서 | 200 | 3.9% |
동 | 160 | 3.1% |
강 | 160 | 3.1% |
대 | 120 | 2.3% |
문 | 120 | 2.3% |
중 | 80 | 1.6% |
Other values (37) | 1800 |
Space Separator
Value | Count | Frequency (%) |
1240 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 5120 | |
Common | 1240 | 19.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
살 | 620 | 12.1% |
인 | 620 | 12.1% |
폭 | 620 | 12.1% |
력 | 620 | 12.1% |
서 | 200 | 3.9% |
동 | 160 | 3.1% |
강 | 160 | 3.1% |
대 | 120 | 2.3% |
문 | 120 | 2.3% |
중 | 80 | 1.6% |
Other values (37) | 1800 |
Common
Value | Count | Frequency (%) |
1240 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 5120 | |
ASCII | 1240 | 19.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1240 |
Hangul
Value | Count | Frequency (%) |
살 | 620 | 12.1% |
인 | 620 | 12.1% |
폭 | 620 | 12.1% |
력 | 620 | 12.1% |
서 | 200 | 3.9% |
동 | 160 | 3.1% |
강 | 160 | 3.1% |
대 | 120 | 2.3% |
문 | 120 | 2.3% |
중 | 80 | 1.6% |
Other values (37) | 1800 |
연령
Categorical
Distinct | 20 |
---|---|
Distinct (%) | 1.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.8 KiB |
남자6세 이하 | 62 |
---|---|
남자12세이하 | 62 |
남자15세이하 | 62 |
남자20세이하 | 62 |
남자30세이하 | 62 |
Other values (15) |
Length
Max length | 7 |
---|---|
Median length | 7 |
Mean length | 6.7 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남자6세 이하 |
---|---|
2nd row | 남자12세이하 |
3rd row | 남자15세이하 |
4th row | 남자20세이하 |
5th row | 남자30세이하 |
Common Values
Value | Count | Frequency (%) |
남자6세 이하 | 62 | 5.0% |
남자12세이하 | 62 | 5.0% |
남자15세이하 | 62 | 5.0% |
남자20세이하 | 62 | 5.0% |
남자30세이하 | 62 | 5.0% |
남자40세이하 | 62 | 5.0% |
남자50세이하 | 62 | 5.0% |
남자60세이하 | 62 | 5.0% |
남자60세초과 | 62 | 5.0% |
남자미상 | 62 | 5.0% |
Other values (10) | 620 |
Length
Value | Count | Frequency (%) |
이하 | 124 | 9.1% |
남자6세 | 62 | 4.5% |
여자6세 | 62 | 4.5% |
여자60세초과 | 62 | 4.5% |
여자60세이하 | 62 | 4.5% |
여자50세이하 | 62 | 4.5% |
여자40세이하 | 62 | 4.5% |
여자30세이하 | 62 | 4.5% |
여자20세이하 | 62 | 4.5% |
여자15세이하 | 62 | 4.5% |
Other values (11) | 682 |
피해자 수
Real number (ℝ)
ZEROS
 
Distinct | 200 |
---|---|
Distinct (%) | 16.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 34.172581 |
Minimum | 0 |
---|---|
Maximum | 489 |
Zeros | 602 |
Zeros (%) | 48.5% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 11.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 1 |
Q3 | 37.25 |
95-th percentile | 181 |
Maximum | 489 |
Range | 489 |
Interquartile range (IQR) | 37.25 |
Descriptive statistics
Standard deviation | 66.146163 |
---|---|
Coefficient of variation (CV) | 1.9356502 |
Kurtosis | 7.0841032 |
Mean | 34.172581 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 2.4617503 |
Sum | 42374 |
Variance | 4375.3148 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 602 | |
1 | 132 | 10.6% |
2 | 47 | 3.8% |
3 | 14 | 1.1% |
8 | 14 | 1.1% |
4 | 13 | 1.0% |
7 | 11 | 0.9% |
5 | 11 | 0.9% |
9 | 7 | 0.6% |
14 | 7 | 0.6% |
Other values (190) | 382 |
Value | Count | Frequency (%) |
0 | 602 | |
1 | 132 | 10.6% |
2 | 47 | 3.8% |
3 | 14 | 1.1% |
4 | 13 | 1.0% |
5 | 11 | 0.9% |
6 | 3 | 0.2% |
7 | 11 | 0.9% |
8 | 14 | 1.1% |
9 | 7 | 0.6% |
Value | Count | Frequency (%) |
489 | 1 | |
454 | 1 | |
397 | 1 | |
396 | 1 | |
323 | 1 | |
319 | 1 | |
313 | 1 | |
312 | 1 | |
305 | 1 | |
298 | 1 |
구분 | 연령 | 피해자 수 | |
---|---|---|---|
구분 | 1.000 | 0.000 | 0.630 |
연령 | 0.000 | 1.000 | 0.472 |
피해자 수 | 0.630 | 0.472 | 1.000 |
피해자 수 | 연령 | |
---|---|---|
피해자 수 | 1.000 | 0.206 |
연령 | 0.206 | 1.000 |
구분 | 연령 | 피해자 수 | |
---|---|---|---|
0 | 중부 살인 | 남자6세 이하 | 0 |
1 | 중부 살인 | 남자12세이하 | 0 |
2 | 중부 살인 | 남자15세이하 | 0 |
3 | 중부 살인 | 남자20세이하 | 0 |
4 | 중부 살인 | 남자30세이하 | 0 |
5 | 중부 살인 | 남자40세이하 | 0 |
6 | 중부 살인 | 남자50세이하 | 0 |
7 | 중부 살인 | 남자60세이하 | 0 |
8 | 중부 살인 | 남자60세초과 | 0 |
9 | 중부 살인 | 남자미상 | 0 |
구분 | 연령 | 피해자 수 | |
---|---|---|---|
1230 | 수서 폭력 | 여자6세 이하 | 0 |
1231 | 수서 폭력 | 여자12세이하 | 1 |
1232 | 수서 폭력 | 여자15세이하 | 6 |
1233 | 수서 폭력 | 여자20세이하 | 20 |
1234 | 수서 폭력 | 여자30세이하 | 83 |
1235 | 수서 폭력 | 여자40세이하 | 85 |
1236 | 수서 폭력 | 여자50세이하 | 88 |
1237 | 수서 폭력 | 여자60세이하 | 68 |
1238 | 수서 폭력 | 여자60세초과 | 62 |
1239 | 수서 폭력 | 여자미상 | 1 |