Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 10000 |
Missing cells | 3 |
Missing cells (%) | < 0.1% |
Duplicate rows | 7 |
Duplicate rows (%) | 0.1% |
Total size in memory | 732.4 KiB |
Average record size in memory | 75.0 B |
Variable types
Text | 1 |
---|---|
Categorical | 5 |
Numeric | 1 |
DateTime | 1 |
Dataset
Description | 지자체별 연도별 분기별 채취량을 수치화한 데이터로 광역, 기초로 나누고 업종에 따라 체계적으로 관리한 분기별 채취현황 데이터 |
---|---|
Author | 국토교통부 |
URL | https://www.data.go.kr/data/15122697/fileData.do |
생성자 has constant value "" | Constant |
Dataset has 7 (0.1%) duplicate rows | Duplicates |
구분 is highly overall correlated with 업종등록명 | High correlation |
업종등록명 is highly overall correlated with 구분 | High correlation |
채취년도 is highly imbalanced (66.4%) | Imbalance |
채취량(생산량) is highly skewed (γ1 = 53.8945305) | Skewed |
채취량(생산량) has 8979 (89.8%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 00:02:43.500508 |
---|---|
Analysis finished | 2023-12-12 00:02:44.552022 |
Duration | 1.05 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
자지체명
Text
Distinct | 182 |
---|---|
Distinct (%) | 1.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
충남 | 1329 | 6.7% |
경기 | 1275 | 6.4% |
경북 | 1205 | 6.0% |
전남 | 947 | 4.7% |
경남 | 941 | 4.7% |
부산 | 861 | 4.3% |
강원 | 793 | 4.0% |
전북 | 739 | 3.7% |
충북 | 620 | 3.1% |
대구 | 390 | 2.0% |
Other values (174) | 10859 |
Most occurring characters
Value | Count | Frequency (%) |
9959 | ||
군 | 4499 | 7.6% |
시 | 3800 | 6.4% |
남 | 3714 | 6.3% |
경 | 3570 | 6.0% |
북 | 2711 | 4.6% |
구 | 2301 | 3.9% |
충 | 1995 | 3.4% |
산 | 1905 | 3.2% |
전 | 1739 | 2.9% |
Other values (108) | 22977 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 49211 | |
Space Separator | 9959 | 16.8% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
군 | 4499 | 9.1% |
시 | 3800 | 7.7% |
남 | 3714 | 7.5% |
경 | 3570 | 7.3% |
북 | 2711 | 5.5% |
구 | 2301 | 4.7% |
충 | 1995 | 4.1% |
산 | 1905 | 3.9% |
전 | 1739 | 3.5% |
기 | 1319 | 2.7% |
Other values (107) | 21658 |
Space Separator
Value | Count | Frequency (%) |
9959 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 49211 | |
Common | 9959 | 16.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
군 | 4499 | 9.1% |
시 | 3800 | 7.7% |
남 | 3714 | 7.5% |
경 | 3570 | 7.3% |
북 | 2711 | 5.5% |
구 | 2301 | 4.7% |
충 | 1995 | 4.1% |
산 | 1905 | 3.9% |
전 | 1739 | 3.5% |
기 | 1319 | 2.7% |
Other values (107) | 21658 |
Common
Value | Count | Frequency (%) |
9959 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 49211 | |
ASCII | 9959 | 16.8% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
9959 |
Hangul
Value | Count | Frequency (%) |
군 | 4499 | 9.1% |
시 | 3800 | 7.7% |
남 | 3714 | 7.5% |
경 | 3570 | 7.3% |
북 | 2711 | 5.5% |
구 | 2301 | 4.7% |
충 | 1995 | 4.1% |
산 | 1905 | 3.9% |
전 | 1739 | 3.5% |
기 | 1319 | 2.7% |
Other values (107) | 21658 |
구분
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
채취실적 | |
---|---|
허가실적 | |
신고채취실적 |
Length
Max length | 6 |
---|---|
Median length | 4 |
Mean length | 4.4696 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 허가실적 |
---|---|
2nd row | 채취실적 |
3rd row | 신고채취실적 |
4th row | 허가실적 |
5th row | 허가실적 |
Common Values
Value | Count | Frequency (%) |
채취실적 | 3852 | |
허가실적 | 3800 | |
신고채취실적 | 2348 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
채취실적 | 3852 | |
허가실적 | 3800 | |
신고채취실적 | 2348 |
업종등록명
Categorical
HIGH CORRELATION
 
Distinct | 12 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
바다골재(모래) | |
---|---|
육상골재(자갈) | |
산림골재(자갈) | |
육상골재(모래) | |
산림골재(모래) | |
Other values (7) |
Length
Max length | 8 |
---|---|
Median length | 8 |
Mean length | 8 |
Min length | 8 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 하천골재(자갈) |
---|---|
2nd row | 하천골재(자갈) |
3rd row | 산림골재(모래) |
4th row | 바다골재(모래) |
5th row | 하천골재(모래) |
Common Values
Value | Count | Frequency (%) |
바다골재(모래) | 1048 | |
육상골재(자갈) | 1023 | |
산림골재(자갈) | 1010 | |
육상골재(모래) | 1009 | |
산림골재(모래) | 997 | |
하천골재(모래) | 995 | |
하천골재(자갈) | 991 | |
바다골재(자갈) | 984 | |
선별파쇄(자갈) | 495 | |
선별세척(자갈) | 492 | |
Other values (2) | 956 |
Length
Value | Count | Frequency (%) |
바다골재(모래 | 1048 | |
육상골재(자갈 | 1023 | |
산림골재(자갈 | 1010 | |
육상골재(모래 | 1009 | |
산림골재(모래 | 997 | |
하천골재(모래 | 995 | |
하천골재(자갈 | 991 | |
바다골재(자갈 | 984 | |
선별파쇄(자갈 | 495 | |
선별세척(자갈 | 492 | |
Other values (2) | 956 |
채취년도
Categorical
IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
2022 | |
---|---|
2020 | 404 |
2021 | 353 |
2019 | 349 |
2023 | 140 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2022 |
---|---|
2nd row | 2022 |
3rd row | 2023 |
4th row | 2022 |
5th row | 2022 |
Common Values
Value | Count | Frequency (%) |
2022 | 8754 | |
2020 | 404 | 4.0% |
2021 | 353 | 3.5% |
2019 | 349 | 3.5% |
2023 | 140 | 1.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2022 | 8754 | |
2020 | 404 | 4.0% |
2021 | 353 | 3.5% |
2019 | 349 | 3.5% |
2023 | 140 | 1.4% |
채취분기
Categorical
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
1 | |
---|---|
2 | |
3 | |
4 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 4 |
---|---|
2nd row | 2 |
3rd row | 2 |
4th row | 4 |
5th row | 2 |
Common Values
Value | Count | Frequency (%) |
1 | 2517 | |
2 | 2505 | |
3 | 2491 | |
4 | 2487 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 2517 | |
2 | 2505 | |
3 | 2491 | |
4 | 2487 |
채취량(생산량)
Real number (ℝ)
SKEWED
  ZEROS
 
Distinct | 303 |
---|---|
Distinct (%) | 3.0% |
Missing | 3 |
Missing (%) | < 0.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 15.713714 |
Minimum | 0 |
---|---|
Maximum | 13561 |
Zeros | 8979 |
Zeros (%) | 89.8% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 0 |
95-th percentile | 54 |
Maximum | 13561 |
Range | 13561 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 173.80823 |
---|---|
Coefficient of variation (CV) | 11.060926 |
Kurtosis | 3872.6896 |
Mean | 15.713714 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 53.894531 |
Sum | 157090 |
Variance | 30209.302 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 8979 | |
2 | 26 | 0.3% |
3 | 21 | 0.2% |
10 | 20 | 0.2% |
5 | 19 | 0.2% |
7 | 18 | 0.2% |
16 | 16 | 0.2% |
15 | 14 | 0.1% |
1 | 14 | 0.1% |
21 | 14 | 0.1% |
Other values (293) | 856 | 8.6% |
Value | Count | Frequency (%) |
0 | 8979 | |
1 | 14 | 0.1% |
2 | 26 | 0.3% |
3 | 21 | 0.2% |
4 | 10 | 0.1% |
5 | 19 | 0.2% |
6 | 11 | 0.1% |
7 | 18 | 0.2% |
8 | 8 | 0.1% |
9 | 9 | 0.1% |
Value | Count | Frequency (%) |
13561 | 1 | |
6221 | 1 | |
2573 | 1 | |
2333 | 1 | |
2307 | 1 | |
2204 | 1 | |
1983 | 1 | |
1707 | 1 | |
1585 | 1 | |
1501 | 1 |
생성일
Date
Distinct | 20 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2020-01-18 00:00:00 |
---|---|
Maximum | 2023-07-20 00:00:00 |
생성자
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
SYSTEM |
---|
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | SYSTEM |
---|---|
2nd row | SYSTEM |
3rd row | SYSTEM |
4th row | SYSTEM |
5th row | SYSTEM |
Common Values
Value | Count | Frequency (%) |
SYSTEM | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
system | 10000 |
구분 | 업종등록명 | 채취년도 | 채취분기 | 채취량(생산량) | 생성일 | |
---|---|---|---|---|---|---|
구분 | 1.000 | 0.882 | 0.164 | 0.000 | 0.017 | 0.256 |
업종등록명 | 0.882 | 1.000 | 0.000 | 0.000 | 0.084 | 0.000 |
채취년도 | 0.164 | 0.000 | 1.000 | 0.000 | 0.029 | 0.997 |
채취분기 | 0.000 | 0.000 | 0.000 | 1.000 | 0.008 | 0.826 |
채취량(생산량) | 0.017 | 0.084 | 0.029 | 0.008 | 1.000 | 0.132 |
생성일 | 0.256 | 0.000 | 0.997 | 0.826 | 0.132 | 1.000 |
업종등록명 | 채취년도 | 채취분기 | 구분 | |
---|---|---|---|---|
업종등록명 | 1.000 | 0.000 | 0.000 | 0.626 |
채취년도 | 0.000 | 1.000 | 0.000 | 0.125 |
채취분기 | 0.000 | 0.000 | 1.000 | 0.000 |
구분 | 0.626 | 0.125 | 0.000 | 1.000 |
채취량(생산량) | 구분 | 업종등록명 | 채취년도 | 채취분기 | |
---|---|---|---|---|---|
채취량(생산량) | 1.000 | 0.016 | 0.039 | 0.024 | 0.003 |
구분 | 0.016 | 1.000 | 0.626 | 0.125 | 0.000 |
업종등록명 | 0.039 | 0.626 | 1.000 | 0.000 | 0.000 |
채취년도 | 0.024 | 0.125 | 0.000 | 1.000 | 0.000 |
채취분기 | 0.003 | 0.000 | 0.000 | 0.000 | 1.000 |
자지체명 | 구분 | 업종등록명 | 채취년도 | 채취분기 | 채취량(생산량) | 생성일 | 생성자 | |
---|---|---|---|---|---|---|---|---|
12516 | 전남 완도군 | 허가실적 | 하천골재(자갈) | 2022 | 4 | 0 | 2023-04-05 | SYSTEM |
2275 | 대구 북구 | 채취실적 | 하천골재(자갈) | 2022 | 2 | 0 | 2022-12-14 | SYSTEM |
4851 | 경기 화성시 | 신고채취실적 | 산림골재(모래) | 2023 | 2 | 0 | 2023-07-20 | SYSTEM |
12041 | 전남 해남군 | 허가실적 | 바다골재(모래) | 2022 | 4 | 231 | 2023-04-05 | SYSTEM |
6204 | 강원 평창군 | 허가실적 | 하천골재(모래) | 2022 | 2 | 1 | 2022-12-14 | SYSTEM |
2354 | 대구 수성구 | 채취실적 | 하천골재(자갈) | 2022 | 2 | 0 | 2022-12-14 | SYSTEM |
8876 | 충남 금산군 | 허가실적 | 바다골재(자갈) | 2022 | 4 | 0 | 2023-04-05 | SYSTEM |
1379 | 부산 사하구 | 허가실적 | 바다골재(자갈) | 2022 | 2 | 0 | 2022-12-14 | SYSTEM |
5387 | 경기 가평군 | 허가실적 | 바다골재(모래) | 2022 | 2 | 0 | 2022-12-14 | SYSTEM |
2934 | 인천 옹진군 | 채취실적 | 산림골재(자갈) | 2022 | 2 | 0 | 2022-12-14 | SYSTEM |
자지체명 | 구분 | 업종등록명 | 채취년도 | 채취분기 | 채취량(생산량) | 생성일 | 생성자 | |
---|---|---|---|---|---|---|---|---|
15141 | 경남 거제시 | 채취실적 | 육상골재(모래) | 2022 | 1 | 0 | 2022-12-14 | SYSTEM |
6306 | 강원 정선군 | 채취실적 | 바다골재(모래) | 2022 | 1 | 0 | 2022-12-14 | SYSTEM |
14924 | 경남 사천시 | 채취실적 | 육상골재(자갈) | 2022 | 3 | 0 | 2022-12-14 | SYSTEM |
9035 | 충남 서천군 | 허가실적 | 바다골재(모래) | 2022 | 4 | 0 | 2023-04-05 | SYSTEM |
6145 | 강원 영월군 | 채취실적 | 육상골재(모래) | 2022 | 1 | 0 | 2022-12-14 | SYSTEM |
3502 | 경기 의정부시 | 채취실적 | 육상골재(모래) | 2022 | 4 | 0 | 2023-04-05 | SYSTEM |
9608 | 충남 예산군 | 채취실적 | 하천골재(모래) | 2021 | 4 | 0 | 2021-07-06 | SYSTEM |
9675 | 충남 예산군 | 신고채취실적 | 선별파쇄(자갈) | 2021 | 3 | 0 | 2021-07-06 | SYSTEM |
10059 | 전북 군산시 | 채취실적 | 산림골재(모래) | 2022 | 2 | 0 | 2022-12-14 | SYSTEM |
13287 | 경북 상주시 | 채취실적 | 산림골재(자갈) | 2022 | 1 | 0 | 2022-12-14 | SYSTEM |
Most frequently occurring
자지체명 | 구분 | 업종등록명 | 채취년도 | 채취분기 | 채취량(생산량) | 생성일 | 생성자 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|
0 | 경북 청송군 | 신고채취실적 | 선별파쇄(모래) | 2022 | 4 | 0 | 2023-04-05 | SYSTEM | 2 |
1 | 경북 청송군 | 채취실적 | 바다골재(모래) | 2022 | 4 | 0 | 2023-04-05 | SYSTEM | 2 |
2 | 경북 청송군 | 채취실적 | 바다골재(자갈) | 2022 | 4 | 0 | 2023-04-05 | SYSTEM | 2 |
3 | 경북 청송군 | 채취실적 | 하천골재(자갈) | 2022 | 4 | 0 | 2023-04-05 | SYSTEM | 2 |
4 | 경북 청송군 | 허가실적 | 산림골재(자갈) | 2022 | 4 | 0 | 2023-04-05 | SYSTEM | 2 |
5 | 경북 청송군 | 허가실적 | 육상골재(모래) | 2022 | 4 | 0 | 2023-04-05 | SYSTEM | 2 |
6 | 경북 청송군 | 허가실적 | 하천골재(자갈) | 2022 | 4 | 0 | 2023-04-05 | SYSTEM | 2 |