Overview

Dataset statistics

Number of variables6
Number of observations7892
Missing cells0
Missing cells (%)0.0%
Duplicate rows935
Duplicate rows (%)11.8%
Total size in memory370.1 KiB
Average record size in memory48.0 B

Variable types

DateTime1
Text1
Categorical4

Dataset

Description검정업무(농산물, 원산지,우수식품, LMO, 술품질인증) 통합 관리 정보(신청일자, 품목, 종류, 생산지, 검정항목, 검정기관 등)
Author국립농산물품질관리원
URLhttps://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20220204000000001680

Alerts

Dataset has 935 (11.8%) duplicate rowsDuplicates
종류 is highly overall correlated with 검정항목High correlation
검정항목 is highly overall correlated with 종류 and 1 other fieldsHigh correlation
검정기관 is highly overall correlated with 검정항목High correlation
검정항목 is highly imbalanced (50.5%)Imbalance
검정기관 is highly imbalanced (70.8%)Imbalance

Reproduction

Analysis started2024-03-23 07:34:07.224486
Analysis finished2024-03-23 07:34:08.707702
Duration1.48 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

Distinct654
Distinct (%)8.3%
Missing0
Missing (%)0.0%
Memory size61.8 KiB
Minimum2010-01-08 00:00:00
Maximum2022-01-13 00:00:00
2024-03-23T07:34:08.912762image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2024-03-23T07:34:09.683124image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)

품목
Text

Distinct73
Distinct (%)0.9%
Missing0
Missing (%)0.0%
Memory size61.8 KiB
2024-03-23T07:34:10.140193image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length11
Median length10
Mean length4.3848201
Min length1

Characters and Unicode

Total characters34605
Distinct characters131
Distinct categories3 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique13 ?
Unique (%)0.2%

Sample

1st row콩나물콩
2nd row콩나물콩
3rd row콩나물콩
4th row콩나물콩
5th row콩나물콩
ValueCountFrequency (%)
호밀 1914
24.3%
라이그라스(이탈리안 954
12.1%
베치 701
 
8.9%
청보리 660
 
8.4%
수단그라스 614
 
7.8%
콩나물콩 295
 
3.7%
귀리 274
 
3.5%
옥수수 272
 
3.4%
페스큐(톨 254
 
3.2%
금계국 188
 
2.4%
Other values (63) 1766
22.4%
2024-03-23T07:34:10.949815image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
3124
 
9.0%
2500
 
7.2%
2461
 
7.1%
2107
 
6.1%
1988
 
5.7%
1962
 
5.7%
1914
 
5.5%
( 1602
 
4.6%
) 1602
 
4.6%
1431
 
4.1%
Other values (121) 13914
40.2%

Most occurring categories

ValueCountFrequency (%)
Other Letter 31401
90.7%
Open Punctuation 1602
 
4.6%
Close Punctuation 1602
 
4.6%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
3124
 
9.9%
2500
 
8.0%
2461
 
7.8%
2107
 
6.7%
1988
 
6.3%
1962
 
6.2%
1914
 
6.1%
1431
 
4.6%
954
 
3.0%
954
 
3.0%
Other values (119) 12006
38.2%
Open Punctuation
ValueCountFrequency (%)
( 1602
100.0%
Close Punctuation
ValueCountFrequency (%)
) 1602
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 31401
90.7%
Common 3204
 
9.3%

Most frequent character per script

Hangul
ValueCountFrequency (%)
3124
 
9.9%
2500
 
8.0%
2461
 
7.8%
2107
 
6.7%
1988
 
6.3%
1962
 
6.2%
1914
 
6.1%
1431
 
4.6%
954
 
3.0%
954
 
3.0%
Other values (119) 12006
38.2%
Common
ValueCountFrequency (%)
( 1602
50.0%
) 1602
50.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 31401
90.7%
ASCII 3204
 
9.3%

Most frequent character per block

Hangul
ValueCountFrequency (%)
3124
 
9.9%
2500
 
8.0%
2461
 
7.8%
2107
 
6.7%
1988
 
6.3%
1962
 
6.2%
1914
 
6.1%
1431
 
4.6%
954
 
3.0%
954
 
3.0%
Other values (119) 12006
38.2%
ASCII
ValueCountFrequency (%)
( 1602
50.0%
) 1602
50.0%

종류
Categorical

HIGH CORRELATION 

Distinct16
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size61.8 KiB
사료.목초종자
2247 
맥류
1839 
농산물종자류
1203 
조사료
1190 
화훼종자류
686 
Other values (11)
727 

Length

Max length7
Median length6
Mean length4.5277496
Min length2

Unique

Unique1 ?
Unique (%)< 0.1%

Sample

1st row두류
2nd row두류
3rd row두류
4th row두류
5th row두류

Common Values

ValueCountFrequency (%)
사료.목초종자 2247
28.5%
맥류 1839
23.3%
농산물종자류 1203
15.2%
조사료 1190
15.1%
화훼종자류 686
 
8.7%
두류 370
 
4.7%
잡곡류 154
 
2.0%
산림종묘 73
 
0.9%
LMO농산물 60
 
0.8%
미곡류 38
 
0.5%
Other values (6) 32
 
0.4%

Length

2024-03-23T07:34:11.360754image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
사료.목초종자 2247
28.5%
맥류 1839
23.3%
농산물종자류 1203
15.2%
조사료 1190
15.1%
화훼종자류 686
 
8.7%
두류 370
 
4.7%
잡곡류 154
 
2.0%
산림종묘 73
 
0.9%
lmo농산물 60
 
0.8%
미곡류 38
 
0.5%
Other values (6) 32
 
0.4%

생산지
Categorical

Distinct22
Distinct (%)0.3%
Missing0
Missing (%)0.0%
Memory size61.8 KiB
미국
3785 
중국
1052 
대한민국(국산)
1038 
캐나다
687 
오스트레일리아(호주)
657 
Other values (17)
673 

Length

Max length11
Median length2
Mean length3.9071211
Min length2

Unique

Unique1 ?
Unique (%)< 0.1%

Sample

1st row중국
2nd row중국
3rd row중국
4th row중국
5th row중국

Common Values

ValueCountFrequency (%)
미국 3785
48.0%
중국 1052
 
13.3%
대한민국(국산) 1038
 
13.2%
캐나다 687
 
8.7%
오스트레일리아(호주) 657
 
8.3%
남아프리카공화국 271
 
3.4%
<NA> 105
 
1.3%
인도 64
 
0.8%
오리건주 52
 
0.7%
스페인 32
 
0.4%
Other values (12) 149
 
1.9%

Length

2024-03-23T07:34:11.595711image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
미국 3785
48.0%
중국 1052
 
13.3%
대한민국(국산 1038
 
13.2%
캐나다 687
 
8.7%
오스트레일리아(호주 657
 
8.3%
남아프리카공화국 271
 
3.4%
na 105
 
1.3%
인도 64
 
0.8%
오리건주 52
 
0.7%
스페인 32
 
0.4%
Other values (12) 149
 
1.9%

검정항목
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct40
Distinct (%)0.5%
Missing0
Missing (%)0.0%
Memory size61.8 KiB
이종종자, 이물, 발아율
2225 
이종종자, 이물, 발아율, 수분
1718 
정립, 발아율
1609 
발아율
1241 
정립, 발아율, 수분
607 
Other values (35)
492 

Length

Max length95
Median length66
Mean length10.914597
Min length2

Unique

Unique11 ?
Unique (%)0.1%

Sample

1st row발아율
2nd row발아율
3rd row발아율
4th row발아율
5th row발아율

Common Values

ValueCountFrequency (%)
이종종자, 이물, 발아율 2225
28.2%
이종종자, 이물, 발아율, 수분 1718
21.8%
정립, 발아율 1609
20.4%
발아율 1241
15.7%
정립, 발아율, 수분 607
 
7.7%
정립, 이물, 발아율 141
 
1.8%
정립, 이종종자, 발아율 90
 
1.1%
수분 76
 
1.0%
이물, 발아율 23
 
0.3%
이물, 싸라기, 색택, 수분 18
 
0.2%
Other values (30) 144
 
1.8%

Length

2024-03-23T07:34:11.826894image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
발아율 7710
36.2%
이물 4202
19.7%
이종종자 4037
18.9%
수분 2527
 
11.9%
정립 2460
 
11.5%
파쇄립 42
 
0.2%
피해립 28
 
0.1%
순도 26
 
0.1%
다른종피색 24
 
0.1%
변질률 24
 
0.1%
Other values (21) 233
 
1.1%

검정기관
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct8
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size61.8 KiB
국립농산물품질관리원 시험연구소 원산지검정과
5744 
국립농산물품질관리원 시험연구소 품질조사과
2122 
국립농산물품질관리원 전남지원 유통관리과
 
13
국립농산물품질관리원 경남지원 유통관리과
 
6
국립농산물품질관리원 경북지원 유통관리과
 
3
Other values (3)
 
4

Length

Max length23
Median length23
Mean length22.724531
Min length21

Unique

Unique2 ?
Unique (%)< 0.1%

Sample

1st row국립농산물품질관리원 시험연구소 원산지검정과
2nd row국립농산물품질관리원 시험연구소 원산지검정과
3rd row국립농산물품질관리원 시험연구소 원산지검정과
4th row국립농산물품질관리원 시험연구소 원산지검정과
5th row국립농산물품질관리원 시험연구소 원산지검정과

Common Values

ValueCountFrequency (%)
국립농산물품질관리원 시험연구소 원산지검정과 5744
72.8%
국립농산물품질관리원 시험연구소 품질조사과 2122
 
26.9%
국립농산물품질관리원 전남지원 유통관리과 13
 
0.2%
국립농산물품질관리원 경남지원 유통관리과 6
 
0.1%
국립농산물품질관리원 경북지원 유통관리과 3
 
< 0.1%
국립농산물품질관리원 전남지원 품질관리과 2
 
< 0.1%
국립농산물품질관리원 충북지원 유통관리과 1
 
< 0.1%
국립농산물품질관리원 전남지원 영광사무소 1
 
< 0.1%

Length

2024-03-23T07:34:12.107425image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-23T07:34:12.593825image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
국립농산물품질관리원 7892
33.3%
시험연구소 7866
33.2%
원산지검정과 5744
24.3%
품질조사과 2122
 
9.0%
유통관리과 23
 
0.1%
전남지원 16
 
0.1%
경남지원 6
 
< 0.1%
경북지원 3
 
< 0.1%
품질관리과 2
 
< 0.1%
충북지원 1
 
< 0.1%

Correlations

2024-03-23T07:34:12.855058image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
품목종류생산지검정항목검정기관
품목1.0000.9950.9430.9550.838
종류0.9951.0000.8230.9200.794
생산지0.9430.8231.0000.7900.244
검정항목0.9550.9200.7901.0000.989
검정기관0.8380.7940.2440.9891.000
2024-03-23T07:34:13.114826image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
검정항목종류생산지검정기관
검정항목1.0000.5400.3100.854
종류0.5401.0000.4180.408
생산지0.3100.4181.0000.103
검정기관0.8540.4080.1031.000
2024-03-23T07:34:13.362874image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
종류생산지검정항목검정기관
종류1.0000.4180.5400.408
생산지0.4181.0000.3100.103
검정항목0.5400.3101.0000.854
검정기관0.4080.1030.8541.000

Missing values

2024-03-23T07:34:08.180665image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-03-23T07:34:08.537220image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

신청일자품목종류생산지검정항목검정기관
02010-01-08콩나물콩두류중국발아율국립농산물품질관리원 시험연구소 원산지검정과
12010-01-08콩나물콩두류중국발아율국립농산물품질관리원 시험연구소 원산지검정과
22010-01-08콩나물콩두류중국발아율국립농산물품질관리원 시험연구소 원산지검정과
32010-01-08콩나물콩두류중국발아율국립농산물품질관리원 시험연구소 원산지검정과
42010-01-08콩나물콩두류중국발아율국립농산물품질관리원 시험연구소 원산지검정과
52010-01-08콩나물콩두류중국발아율국립농산물품질관리원 시험연구소 원산지검정과
62010-01-08콩나물콩두류중국발아율국립농산물품질관리원 시험연구소 원산지검정과
72010-01-08콩나물콩두류중국발아율국립농산물품질관리원 시험연구소 원산지검정과
82010-01-08콩나물콩두류중국발아율국립농산물품질관리원 시험연구소 원산지검정과
92010-01-08콩나물콩두류중국발아율국립농산물품질관리원 시험연구소 원산지검정과
신청일자품목종류생산지검정항목검정기관
78822022-01-13콩나물콩두류대한민국(국산)발아율국립농산물품질관리원 시험연구소 품질조사과
78832022-01-13콩나물콩두류대한민국(국산)발아율국립농산물품질관리원 시험연구소 품질조사과
78842022-01-13콩나물콩두류대한민국(국산)발아율국립농산물품질관리원 시험연구소 품질조사과
78852022-01-13콩나물콩두류대한민국(국산)발아율국립농산물품질관리원 시험연구소 품질조사과
78862022-01-13콩나물콩두류대한민국(국산)발아율국립농산물품질관리원 시험연구소 품질조사과
78872022-01-13콩나물콩두류대한민국(국산)발아율국립농산물품질관리원 시험연구소 품질조사과
78882022-01-13콩나물콩두류대한민국(국산)발아율국립농산물품질관리원 시험연구소 품질조사과
78892022-01-13콩나물콩두류대한민국(국산)발아율국립농산물품질관리원 시험연구소 품질조사과
78902022-01-13콩나물콩두류대한민국(국산)발아율국립농산물품질관리원 시험연구소 품질조사과
78912022-01-13콩나물콩두류대한민국(국산)발아율국립농산물품질관리원 시험연구소 품질조사과

Duplicate rows

Most frequently occurring

신청일자품목종류생산지검정항목검정기관# duplicates
9312020-12-11콩나물콩두류대한민국(국산)발아율국립농산물품질관리원 시험연구소 품질조사과67
9222019-11-26콩나물콩두류대한민국(국산)발아율국립농산물품질관리원 시험연구소 품질조사과66
8742016-08-29라이그라스(이탈리안)사료.목초종자미국이종종자, 이물, 발아율국립농산물품질관리원 시험연구소 품질조사과60
3132012-07-12청보리농산물종자류대한민국(국산)이종종자, 이물, 발아율, 수분국립농산물품질관리원 시험연구소 원산지검정과47
8402016-07-13호밀맥류미국이종종자, 이물, 발아율국립농산물품질관리원 시험연구소 품질조사과45
362010-07-09청보리농산물종자류대한민국(국산)정립, 발아율, 수분국립농산물품질관리원 시험연구소 원산지검정과44
502010-07-26청보리농산물종자류대한민국(국산)정립, 발아율, 수분국립농산물품질관리원 시험연구소 원산지검정과44
8512016-07-25호밀맥류미국이종종자, 이물, 발아율, 수분국립농산물품질관리원 시험연구소 품질조사과43
8102016-01-28옥수수잡곡류미국이종종자, 이물, 발아율국립농산물품질관리원 시험연구소 품질조사과37
8442016-07-19호밀맥류미국이종종자, 이물, 발아율, 수분국립농산물품질관리원 시험연구소 품질조사과37