Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 1109 |
Duplicate rows (%) | 11.1% |
Total size in memory | 712.9 KiB |
Average record size in memory | 73.0 B |
Variable types
DateTime | 1 |
---|---|
Text | 4 |
Categorical | 2 |
Numeric | 1 |
Dataset
Description | 거래일,품목,품종,단위,등급,가격,출하지,친환경구분(일반) |
---|---|
Author | 서울시농수산식품공사 |
URL | https://data.seoul.go.kr/dataList/OA-20950/S/1/datasetView.do |
친환경구분(일반) has constant value "" | Constant |
Dataset has 1109 (11.1%) duplicate rows | Duplicates |
등급 is highly imbalanced (87.5%) | Imbalance |
Reproduction
Analysis started | 2024-05-11 06:23:16.566457 |
---|---|
Analysis finished | 2024-05-11 06:23:19.000109 |
Duration | 2.43 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
거래일
Date
Distinct | 48 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2024-03-05 00:00:00 |
---|---|
Maximum | 2024-05-10 00:00:00 |
품목
Text
Distinct | 131 |
---|---|
Distinct (%) | 1.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
기타 | 1011 | 9.1% |
채소류 | 938 | 8.4% |
콩나물 | 898 | 8.1% |
마늘 | 750 | 6.7% |
베이비 | 684 | 6.1% |
숙주나물 | 666 | 6.0% |
두부 | 659 | 5.9% |
고사리 | 522 | 4.7% |
새싹 | 413 | 3.7% |
무순 | 394 | 3.5% |
Other values (126) | 4211 |
Most occurring characters
Value | Count | Frequency (%) |
물 | 2150 | 7.0% |
나 | 2142 | 7.0% |
류 | 1443 | 4.7% |
1146 | 3.8% | |
고 | 1113 | 3.6% |
기 | 1025 | 3.4% |
타 | 1017 | 3.3% |
마 | 953 | 3.1% |
채 | 943 | 3.1% |
소 | 938 | 3.1% |
Other values (172) | 17677 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 29283 | |
Space Separator | 1146 | 3.8% |
Open Punctuation | 59 | 0.2% |
Close Punctuation | 59 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
물 | 2150 | 7.3% |
나 | 2142 | 7.3% |
류 | 1443 | 4.9% |
고 | 1113 | 3.8% |
기 | 1025 | 3.5% |
타 | 1017 | 3.5% |
마 | 953 | 3.3% |
채 | 943 | 3.2% |
소 | 938 | 3.2% |
콩 | 907 | 3.1% |
Other values (169) | 16652 |
Space Separator
Value | Count | Frequency (%) |
1146 |
Open Punctuation
Value | Count | Frequency (%) |
( | 59 |
Close Punctuation
Value | Count | Frequency (%) |
) | 59 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 29283 | |
Common | 1264 | 4.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
물 | 2150 | 7.3% |
나 | 2142 | 7.3% |
류 | 1443 | 4.9% |
고 | 1113 | 3.8% |
기 | 1025 | 3.5% |
타 | 1017 | 3.5% |
마 | 953 | 3.3% |
채 | 943 | 3.2% |
소 | 938 | 3.2% |
콩 | 907 | 3.1% |
Other values (169) | 16652 |
Common
Value | Count | Frequency (%) |
1146 | ||
( | 59 | 4.7% |
) | 59 | 4.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 29283 | |
ASCII | 1264 | 4.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
물 | 2150 | 7.3% |
나 | 2142 | 7.3% |
류 | 1443 | 4.9% |
고 | 1113 | 3.8% |
기 | 1025 | 3.5% |
타 | 1017 | 3.5% |
마 | 953 | 3.3% |
채 | 943 | 3.2% |
소 | 938 | 3.2% |
콩 | 907 | 3.1% |
Other values (169) | 16652 |
ASCII
Value | Count | Frequency (%) |
1146 | ||
( | 59 | 4.7% |
) | 59 | 4.7% |
품종
Text
Distinct | 225 |
---|---|
Distinct (%) | 2.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
수입 | 3514 | |
기타(상장예외 | 948 | 5.9% |
채소류 | 938 | 5.8% |
콩나물 | 898 | 5.6% |
베이비 | 684 | 4.3% |
숙주나물 | 666 | 4.1% |
고사리 | 506 | 3.1% |
깐마늘 | 447 | 2.8% |
새싹 | 413 | 2.6% |
무순 | 394 | 2.5% |
Other values (206) | 6659 |
Most occurring characters
Value | Count | Frequency (%) |
6067 | 10.8% | |
수 | 3551 | 6.3% |
입 | 3519 | 6.3% |
물 | 2323 | 4.1% |
나 | 2142 | 3.8% |
) | 1323 | 2.4% |
( | 1323 | 2.4% |
류 | 1284 | 2.3% |
장 | 1268 | 2.3% |
채 | 1177 | 2.1% |
Other values (210) | 32072 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 47336 | |
Space Separator | 6067 | 10.8% |
Close Punctuation | 1323 | 2.4% |
Open Punctuation | 1323 | 2.4% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
수 | 3551 | 7.5% |
입 | 3519 | 7.4% |
물 | 2323 | 4.9% |
나 | 2142 | 4.5% |
류 | 1284 | 2.7% |
장 | 1268 | 2.7% |
채 | 1177 | 2.5% |
고 | 1113 | 2.4% |
기 | 1039 | 2.2% |
타 | 1031 | 2.2% |
Other values (207) | 28889 |
Space Separator
Value | Count | Frequency (%) |
6067 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1323 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1323 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 47336 | |
Common | 8713 | 15.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
수 | 3551 | 7.5% |
입 | 3519 | 7.4% |
물 | 2323 | 4.9% |
나 | 2142 | 4.5% |
류 | 1284 | 2.7% |
장 | 1268 | 2.7% |
채 | 1177 | 2.5% |
고 | 1113 | 2.4% |
기 | 1039 | 2.2% |
타 | 1031 | 2.2% |
Other values (207) | 28889 |
Common
Value | Count | Frequency (%) |
6067 | ||
) | 1323 | 15.2% |
( | 1323 | 15.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 47336 | |
ASCII | 8713 | 15.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
6067 | ||
) | 1323 | 15.2% |
( | 1323 | 15.2% |
Hangul
Value | Count | Frequency (%) |
수 | 3551 | 7.5% |
입 | 3519 | 7.4% |
물 | 2323 | 4.9% |
나 | 2142 | 4.5% |
류 | 1284 | 2.7% |
장 | 1268 | 2.7% |
채 | 1177 | 2.5% |
고 | 1113 | 2.4% |
기 | 1039 | 2.2% |
타 | 1031 | 2.2% |
Other values (207) | 28889 |
단위
Text
Distinct | 121 |
---|---|
Distinct (%) | 1.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
10키로 | 1647 | |
3.5키로 | 1197 | |
4키로 | 1150 | |
1키로 | 1097 | |
500그람 | 731 | |
20키로 | 651 | 6.5% |
50그람 | 485 | 4.9% |
2키로 | 475 | 4.8% |
5키로 | 434 | 4.3% |
12키로 | 328 | 3.3% |
Other values (106) | 1805 |
Most occurring characters
Value | Count | Frequency (%) |
키 | 8248 | |
로 | 8248 | |
0 | 4889 | |
1 | 3816 | |
5 | 3364 | |
그 | 1752 | 4.5% |
람 | 1752 | 4.5% |
2 | 1637 | 4.2% |
. | 1497 | 3.8% |
3 | 1398 | 3.6% |
Other values (5) | 2315 | 5.9% |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 20000 | |
Decimal Number | 17419 | |
Other Punctuation | 1497 | 3.8% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 4889 | |
1 | 3816 | |
5 | 3364 | |
2 | 1637 | 9.4% |
3 | 1398 | 8.0% |
4 | 1323 | 7.6% |
6 | 504 | 2.9% |
8 | 164 | 0.9% |
7 | 163 | 0.9% |
9 | 161 | 0.9% |
Other Letter
Value | Count | Frequency (%) |
키 | 8248 | |
로 | 8248 | |
그 | 1752 | 8.8% |
람 | 1752 | 8.8% |
Other Punctuation
Value | Count | Frequency (%) |
. | 1497 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 20000 | |
Common | 18916 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 4889 | |
1 | 3816 | |
5 | 3364 | |
2 | 1637 | 8.7% |
. | 1497 | 7.9% |
3 | 1398 | 7.4% |
4 | 1323 | 7.0% |
6 | 504 | 2.7% |
8 | 164 | 0.9% |
7 | 163 | 0.9% |
Hangul
Value | Count | Frequency (%) |
키 | 8248 | |
로 | 8248 | |
그 | 1752 | 8.8% |
람 | 1752 | 8.8% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 20000 | |
ASCII | 18916 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
키 | 8248 | |
로 | 8248 | |
그 | 1752 | 8.8% |
람 | 1752 | 8.8% |
ASCII
Value | Count | Frequency (%) |
0 | 4889 | |
1 | 3816 | |
5 | 3364 | |
2 | 1637 | 8.7% |
. | 1497 | 7.9% |
3 | 1398 | 7.4% |
4 | 1323 | 7.0% |
6 | 504 | 2.7% |
8 | 164 | 0.9% |
7 | 163 | 0.9% |
등급
Categorical
IMBALANCE
 
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
기타 | |
---|---|
중 | 126 |
대 | 125 |
등외 | 94 |
소 | 84 |
Other values (3) | 33 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 1.9632 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 기타 |
---|---|
2nd row | 기타 |
3rd row | 기타 |
4th row | 기타 |
5th row | 기타 |
Common Values
Value | Count | Frequency (%) |
기타 | 9538 | |
중 | 126 | 1.3% |
대 | 125 | 1.2% |
등외 | 94 | 0.9% |
소 | 84 | 0.8% |
상 | 27 | 0.3% |
특 | 4 | < 0.1% |
하 | 2 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
기타 | 9538 | |
중 | 126 | 1.3% |
대 | 125 | 1.2% |
등외 | 94 | 0.9% |
소 | 84 | 0.8% |
상 | 27 | 0.3% |
특 | 4 | < 0.1% |
하 | 2 | < 0.1% |
가격
Real number (ℝ)
Distinct | 541 |
---|---|
Distinct (%) | 5.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 29063.392 |
Minimum | 300 |
---|---|
Maximum | 3000000 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 300 |
---|---|
5-th percentile | 750 |
Q1 | 4300 |
median | 12000 |
Q3 | 30000 |
95-th percentile | 123000 |
Maximum | 3000000 |
Range | 2999700 |
Interquartile range (IQR) | 25700 |
Descriptive statistics
Standard deviation | 56598.048 |
---|---|
Coefficient of variation (CV) | 1.9473999 |
Kurtosis | 778.7472 |
Mean | 29063.392 |
Median Absolute Deviation (MAD) | 9300 |
Skewness | 17.29018 |
Sum | 2.9063392 × 108 |
Variance | 3.203339 × 109 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2700 | 482 | 4.8% |
4600 | 269 | 2.7% |
18000 | 256 | 2.6% |
10700 | 242 | 2.4% |
4300 | 223 | 2.2% |
17000 | 205 | 2.1% |
7500 | 177 | 1.8% |
850 | 177 | 1.8% |
4800 | 167 | 1.7% |
21000 | 157 | 1.6% |
Other values (531) | 7645 |
Value | Count | Frequency (%) |
300 | 1 | < 0.1% |
320 | 8 | 0.1% |
350 | 2 | < 0.1% |
360 | 19 | 0.2% |
370 | 141 | |
380 | 1 | < 0.1% |
390 | 9 | 0.1% |
400 | 12 | 0.1% |
480 | 17 | 0.2% |
490 | 2 | < 0.1% |
Value | Count | Frequency (%) |
3000000 | 1 | |
910000 | 1 | |
780000 | 1 | |
750000 | 1 | |
650000 | 1 | |
520000 | 1 | |
494172 | 2 | |
465000 | 1 | |
440000 | 1 | |
435000 | 1 |
출하지
Text
Distinct | 161 |
---|---|
Distinct (%) | 1.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
중국 | 3618 | |
경기도 | 1852 | 12.6% |
전라남도 | 1036 | 7.0% |
광주시 | 701 | 4.8% |
페루 | 406 | 2.8% |
경상남도 | 405 | 2.8% |
제주자치도 | 361 | 2.5% |
경상북도 | 357 | 2.4% |
태국 | 307 | 2.1% |
충청남도 | 296 | 2.0% |
Other values (163) | 5370 |
Most occurring characters
Value | Count | Frequency (%) |
도 | 4898 | 10.3% |
4709 | 9.9% | |
국 | 4015 | 8.5% |
중 | 3620 | 7.6% |
시 | 3540 | 7.5% |
경 | 2629 | 5.5% |
남 | 2164 | 4.6% |
기 | 1879 | 4.0% |
주 | 1599 | 3.4% |
군 | 1393 | 2.9% |
Other values (152) | 17022 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 42757 | |
Space Separator | 4709 | 9.9% |
Close Punctuation | 1 | < 0.1% |
Open Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 4898 | 11.5% |
국 | 4015 | 9.4% |
중 | 3620 | 8.5% |
시 | 3540 | 8.3% |
경 | 2629 | 6.1% |
남 | 2164 | 5.1% |
기 | 1879 | 4.4% |
주 | 1599 | 3.7% |
군 | 1393 | 3.3% |
라 | 1098 | 2.6% |
Other values (149) | 15922 |
Space Separator
Value | Count | Frequency (%) |
4709 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 42757 | |
Common | 4711 | 9.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 4898 | 11.5% |
국 | 4015 | 9.4% |
중 | 3620 | 8.5% |
시 | 3540 | 8.3% |
경 | 2629 | 6.1% |
남 | 2164 | 5.1% |
기 | 1879 | 4.4% |
주 | 1599 | 3.7% |
군 | 1393 | 3.3% |
라 | 1098 | 2.6% |
Other values (149) | 15922 |
Common
Value | Count | Frequency (%) |
4709 | ||
) | 1 | < 0.1% |
( | 1 | < 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 42757 | |
ASCII | 4711 | 9.9% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
도 | 4898 | 11.5% |
국 | 4015 | 9.4% |
중 | 3620 | 8.5% |
시 | 3540 | 8.3% |
경 | 2629 | 6.1% |
남 | 2164 | 5.1% |
기 | 1879 | 4.4% |
주 | 1599 | 3.7% |
군 | 1393 | 3.3% |
라 | 1098 | 2.6% |
Other values (149) | 15922 |
ASCII
Value | Count | Frequency (%) |
4709 | ||
) | 1 | < 0.1% |
( | 1 | < 0.1% |
친환경구분(일반)
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
일반 |
---|
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 일반 |
---|---|
2nd row | 일반 |
3rd row | 일반 |
4th row | 일반 |
5th row | 일반 |
Common Values
Value | Count | Frequency (%) |
일반 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
일반 | 10000 |
거래일 | 등급 | 가격 | |
---|---|---|---|
거래일 | 1.000 | 0.026 | 0.000 |
등급 | 0.026 | 1.000 | 0.234 |
가격 | 0.000 | 0.234 | 1.000 |
가격 | 등급 | |
---|---|---|
가격 | 1.000 | 0.145 |
등급 | 0.145 | 1.000 |
거래일 | 품목 | 품종 | 단위 | 등급 | 가격 | 출하지 | 친환경구분(일반) | |
---|---|---|---|---|---|---|---|---|
78646 | 2024-03-19 | 고사리 | 고사리 수입 | 10키로 | 기타 | 17000 | 중국 | 일반 |
4567 | 2024-05-08 | 채소류 기타 | 채소류 기타(상장예외) | 10키로 | 기타 | 20000 | 경기도 이천시 | 일반 |
12937 | 2024-05-02 | 고구마 | 밤 고구마 | 10키로 | 기타 | 23000 | 경기도 이천시 | 일반 |
68755 | 2024-03-25 | 채소류 기타 | 채소류 기타(상장예외) | 10키로 | 기타 | 21000 | 제주자치도 서귀포시 | 일반 |
33816 | 2024-04-17 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 |
28166 | 2024-04-22 | 마늘 | 마늘 쫑 수입 | 7키로 | 기타 | 23000 | 중국 | 일반 |
7590 | 2024-05-07 | 숙주나물 | 숙주나물 수입 | 3.5키로 | 기타 | 4600 | 중국 | 일반 |
73400 | 2024-03-21 | 두부 | 포장두부 | 6.6키로 | 기타 | 16000 | 인도 | 일반 |
20848 | 2024-04-25 | 고구마 | 밤 고구마 | 10키로 | 기타 | 25000 | 경기도 여주시 | 일반 |
11380 | 2024-05-02 | 두부 | 순두부 | 16키로 | 기타 | 19000 | 중국 | 일반 |
거래일 | 품목 | 품종 | 단위 | 등급 | 가격 | 출하지 | 친환경구분(일반) | |
---|---|---|---|---|---|---|---|---|
45448 | 2024-04-09 | 숙주나물 | 숙주나물 수입 | 3.5키로 | 기타 | 4500 | 중국 | 일반 |
90794 | 2024-03-11 | 콩나물 | 콩나물 수입 | 6키로 | 기타 | 7700 | 중국 | 일반 |
41775 | 2024-04-11 | 조미오징어류 | 조미오징어류 | 10키로 | 기타 | 265000 | 페루 | 일반 |
97641 | 2024-03-06 | 두부 | 연두부 | 12키로 | 기타 | 10700 | 중국 | 일반 |
76848 | 2024-03-20 | 도라지 | 깐도라지 수입 | 10키로 | 기타 | 43000 | 중국 | 일반 |
49704 | 2024-04-05 | 두부 | 포장두부 | 12키로 | 기타 | 17000 | 인도 | 일반 |
31970 | 2024-04-18 | 베이비 | 베이비 | 500그람 | 기타 | 4200 | 경기도 광주시 | 일반 |
66550 | 2024-03-26 | 망고 | 망고 수입 | 5키로 | 기타 | 37000 | 태국 | 일반 |
47170 | 2024-04-08 | 방풍나물 | 방풍나물 | 2키로 | 기타 | 4500 | 전라남도 여수시 | 일반 |
68086 | 2024-03-26 | 마늘 | 깐마늘 대서 | 20키로 | 소 | 115000 | 경상남도 창녕군 | 일반 |
Most frequently occurring
거래일 | 품목 | 품종 | 단위 | 등급 | 가격 | 출하지 | 친환경구분(일반) | # duplicates | |
---|---|---|---|---|---|---|---|---|---|
270 | 2024-03-20 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 | 13 |
83 | 2024-03-08 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 | 12 |
199 | 2024-03-15 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 | 12 |
485 | 2024-04-02 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 | 12 |
153 | 2024-03-13 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 | 11 |
413 | 2024-03-28 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 | 11 |
434 | 2024-03-29 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 | 11 |
953 | 2024-04-30 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 | 11 |
40 | 2024-03-06 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 | 10 |
65 | 2024-03-07 | 콩나물 | 콩나물 수입 | 3.5키로 | 기타 | 2700 | 중국 | 일반 | 10 |