Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 4110 |
Missing cells | 4 |
Missing cells (%) | < 0.1% |
Duplicate rows | 863 |
Duplicate rows (%) | 21.0% |
Total size in memory | 128.6 KiB |
Average record size in memory | 32.0 B |
Variable types
DateTime | 1 |
---|---|
Categorical | 2 |
Text | 1 |
Dataset
Description | 한국저작권보호원이 수행하는 불법복제물 수거·폐기 및 삭제업무 관련 오프라인 불법복제물 예방현황 정보 |
---|---|
Author | (재)한국저작권보호원 |
URL | https://www.data.go.kr/data/15071051/fileData.do |
Dataset has 863 (21.0%) duplicate rows | Duplicates |
광역시/도 is highly overall correlated with 단속예방구분 | High correlation |
단속예방구분 is highly overall correlated with 광역시/도 | High correlation |
단속예방구분 is highly imbalanced (50.1%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 21:56:27.893480 |
---|---|
Analysis finished | 2023-12-12 21:56:28.315001 |
Duration | 0.42 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
예방일자
Date
Distinct | 195 |
---|---|
Distinct (%) | 4.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 32.2 KiB |
Minimum | 2018-01-18 00:00:00 |
---|---|
Maximum | 2019-12-18 00:00:00 |
광역시/도
Categorical
HIGH CORRELATION
 
Distinct | 20 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 32.2 KiB |
광주 | |
---|---|
서울 | |
부산 | |
대구 | |
경북 | |
Other values (15) |
Length
Max length | 3 |
---|---|
Median length | 2 |
Mean length | 2.029927 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울 |
---|---|
2nd row | 서울 |
3rd row | 경남 |
4th row | 경기 |
5th row | 울산 |
Common Values
Value | Count | Frequency (%) |
광주 | 679 | |
서울 | 560 | |
부산 | 465 | |
대구 | 410 | |
경북 | 303 | |
경기 | 285 | |
전남 | 278 | |
경남 | 238 | 5.8% |
충남 | 165 | 4.0% |
전북 | 112 | 2.7% |
Other values (10) | 615 |
Length
Value | Count | Frequency (%) |
광주 | 679 | |
서울 | 560 | |
부산 | 472 | |
경북 | 411 | |
대구 | 410 | |
경기 | 285 | |
전남 | 278 | |
경남 | 238 | 5.8% |
충남 | 165 | 4.0% |
전북 | 120 | 2.9% |
Other values (7) | 492 |
시/군/구
Text
Distinct | 173 |
---|---|
Distinct (%) | 4.2% |
Missing | 4 |
Missing (%) | 0.1% |
Memory size | 32.2 KiB |
Value | Count | Frequency (%) |
북구 | 456 | 11.1% |
남구 | 295 | 7.2% |
동구 | 217 | 5.3% |
광산구 | 139 | 3.4% |
중구 | 138 | 3.4% |
경산시 | 135 | 3.3% |
금정구 | 132 | 3.2% |
천안시 | 75 | 1.8% |
부산진구 | 75 | 1.8% |
동작구 | 70 | 1.7% |
Other values (155) | 2374 |
Most occurring characters
Value | Count | Frequency (%) |
구 | 2449 | |
시 | 1400 | 12.2% |
산 | 558 | 4.9% |
북 | 518 | 4.5% |
동 | 403 | 3.5% |
남 | 361 | 3.2% |
군 | 353 | 3.1% |
주 | 336 | 2.9% |
천 | 296 | 2.6% |
성 | 262 | 2.3% |
Other values (108) | 4516 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 11423 | |
Space Separator | 29 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 2449 | |
시 | 1400 | 12.3% |
산 | 558 | 4.9% |
북 | 518 | 4.5% |
동 | 403 | 3.5% |
남 | 361 | 3.2% |
군 | 353 | 3.1% |
주 | 336 | 2.9% |
천 | 296 | 2.6% |
성 | 262 | 2.3% |
Other values (107) | 4487 |
Space Separator
Value | Count | Frequency (%) |
29 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 11423 | |
Common | 29 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 2449 | |
시 | 1400 | 12.3% |
산 | 558 | 4.9% |
북 | 518 | 4.5% |
동 | 403 | 3.5% |
남 | 361 | 3.2% |
군 | 353 | 3.1% |
주 | 336 | 2.9% |
천 | 296 | 2.6% |
성 | 262 | 2.3% |
Other values (107) | 4487 |
Common
Value | Count | Frequency (%) |
29 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 11423 | |
ASCII | 29 | 0.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
구 | 2449 | |
시 | 1400 | 12.3% |
산 | 558 | 4.9% |
북 | 518 | 4.5% |
동 | 403 | 3.5% |
남 | 361 | 3.2% |
군 | 353 | 3.1% |
주 | 336 | 2.9% |
천 | 296 | 2.6% |
성 | 262 | 2.3% |
Other values (107) | 4487 |
ASCII
Value | Count | Frequency (%) |
29 |
단속예방구분
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 32.2 KiB |
예방활동 | |
---|---|
계도예방 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 예방활동 |
---|---|
2nd row | 예방활동 |
3rd row | 예방활동 |
4th row | 예방활동 |
5th row | 예방활동 |
Common Values
Value | Count | Frequency (%) |
예방활동 | 3659 | |
계도예방 | 451 | 11.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
예방활동 | 3659 | |
계도예방 | 451 | 11.0% |
광역시/도 | 단속예방구분 | |
---|---|---|
광역시/도 | 1.000 | 0.695 |
단속예방구분 | 0.695 | 1.000 |
단속예방구분 | 광역시/도 | |
---|---|---|
단속예방구분 | 1.000 | 0.559 |
광역시/도 | 0.559 | 1.000 |
광역시/도 | 단속예방구분 | |
---|---|---|
광역시/도 | 1.000 | 0.559 |
단속예방구분 | 0.559 | 1.000 |
예방일자 | 광역시/도 | 시/군/구 | 단속예방구분 | |
---|---|---|---|---|
0 | 2018-01-18 | 서울 | 종로구 | 예방활동 |
1 | 2018-01-25 | 서울 | 동작구 | 예방활동 |
2 | 2018-01-29 | 경남 | 진주시 | 예방활동 |
3 | 2018-02-20 | 경기 | 안산시 | 예방활동 |
4 | 2018-02-23 | 울산 | 울주군 | 예방활동 |
5 | 2018-02-26 | 부산 | 금정구 | 예방활동 |
6 | 2018-02-26 | 부산 | 금정구 | 예방활동 |
7 | 2018-02-26 | 부산 | 금정구 | 예방활동 |
8 | 2018-02-26 | 경남 | 밀양시 | 예방활동 |
9 | 2018-02-26 | 대구 | 수성구 | 예방활동 |
예방일자 | 광역시/도 | 시/군/구 | 단속예방구분 | |
---|---|---|---|---|
4100 | 2019-07-19 | 서울 | 강남구 | 예방활동 |
4101 | 2019-07-19 | 서울 | 강남구 | 예방활동 |
4102 | 2019-07-19 | 서울 | 강남구 | 예방활동 |
4103 | 2019-07-19 | 서울 | 강남구 | 예방활동 |
4104 | 2019-07-19 | 서울 | 강남구 | 예방활동 |
4105 | 2019-07-19 | 서울 | 강남구 | 예방활동 |
4106 | 2019-07-19 | 서울 | 강남구 | 예방활동 |
4107 | 2019-12-18 | 경기 | 고양시 | 예방활동 |
4108 | 2019-12-18 | 경기 | 고양시 | 예방활동 |
4109 | 2019-12-18 | 경기 | 고양시 | 예방활동 |
Most frequently occurring
예방일자 | 광역시/도 | 시/군/구 | 단속예방구분 | # duplicates | |
---|---|---|---|---|---|
302 | 2018-07-17 | 광주 | 북구 | 예방활동 | 35 |
341 | 2018-08-27 | 광주 | 북구 | 예방활동 | 28 |
315 | 2018-07-19 | 광주 | 동구 | 예방활동 | 25 |
517 | 2018-09-17 | 광주 | 북구 | 예방활동 | 24 |
331 | 2018-08-20 | 광주 | 북구 | 예방활동 | 21 |
321 | 2018-07-19 | 서울 | 동작구 | 예방활동 | 19 |
139 | 2018-03-26 | 광주 | 북구 | 예방활동 | 15 |
296 | 2018-07-16 | 광주 | 동구 | 예방활동 | 15 |
595 | 2019-03-05 | 경북 | 경산시 | 계도예방 | 15 |
689 | 2019-03-19 | 광주 | 북구 | 예방활동 | 15 |