Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 3508 |
Missing cells | 3 |
Missing cells (%) | < 0.1% |
Duplicate rows | 9 |
Duplicate rows (%) | 0.3% |
Total size in memory | 109.8 KiB |
Average record size in memory | 32.0 B |
Variable types
Text | 3 |
---|---|
Categorical | 1 |
Dataset
Description | 종자업 등록과 종자보증을 수행하는 종자관리사의 현황(종자관리사 등록번호, 관리품목, 성명, 주소 등) 데이터를 확인가능함 |
---|---|
URL | https://www.data.go.kr/data/15008338/fileData.do |
Dataset has 9 (0.3%) duplicate rows | Duplicates |
Reproduction
Analysis started | 2023-12-12 16:18:45.905572 |
---|---|
Analysis finished | 2023-12-12 16:18:46.404305 |
Duration | 0.5 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
등록번호
Text
Distinct | 3499 |
---|---|
Distinct (%) | 99.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 27.5 KiB |
Length
Max length | 14 |
---|---|
Median length | 12 |
Mean length | 12.368871 |
Min length | 9 |
Characters and Unicode
Total characters | 43390 |
---|---|
Distinct characters | 11 |
Distinct categories | 2 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 3490 ? |
---|---|
Unique (%) | 99.5% |
Sample
1st row | 2022-11-003179 |
---|---|
2nd row | 2022-11-003178 |
3rd row | 2022-22-003177 |
4th row | 2022-11-003176 |
5th row | 2022-11-003175 |
Value | Count | Frequency (%) |
2007-11-936 | 2 | 0.1% |
2007-11-938 | 2 | 0.1% |
2007-22-250 | 2 | 0.1% |
2007-22-251 | 2 | 0.1% |
2007-11-934 | 2 | 0.1% |
2007-11-937 | 2 | 0.1% |
2007-11-939 | 2 | 0.1% |
2007-11-935 | 2 | 0.1% |
2007-11-940 | 2 | 0.1% |
2007-11-932 | 1 | < 0.1% |
Other values (3489) | 3489 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 9796 | |
0 | 8373 | |
2 | 7879 | |
- | 7016 | |
9 | 2371 | 5.5% |
8 | 1663 | 3.8% |
3 | 1411 | 3.3% |
6 | 1249 | 2.9% |
7 | 1246 | 2.9% |
5 | 1209 | 2.8% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 36374 | |
Dash Punctuation | 7016 | 16.2% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 9796 | |
0 | 8373 | |
2 | 7879 | |
9 | 2371 | 6.5% |
8 | 1663 | 4.6% |
3 | 1411 | 3.9% |
6 | 1249 | 3.4% |
7 | 1246 | 3.4% |
5 | 1209 | 3.3% |
4 | 1177 | 3.2% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 7016 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 43390 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 9796 | |
0 | 8373 | |
2 | 7879 | |
- | 7016 | |
9 | 2371 | 5.5% |
8 | 1663 | 3.8% |
3 | 1411 | 3.3% |
6 | 1249 | 2.9% |
7 | 1246 | 2.9% |
5 | 1209 | 2.8% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 43390 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 9796 | |
0 | 8373 | |
2 | 7879 | |
- | 7016 | |
9 | 2371 | 5.5% |
8 | 1663 | 3.8% |
3 | 1411 | 3.3% |
6 | 1249 | 2.9% |
7 | 1246 | 2.9% |
5 | 1209 | 2.8% |
관리품목
Categorical
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 27.5 KiB |
일반 | |
---|---|
버섯 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 일반 |
---|---|
2nd row | 일반 |
3rd row | 버섯 |
4th row | 일반 |
5th row | 일반 |
Common Values
Value | Count | Frequency (%) |
일반 | 2707 | |
버섯 | 801 | 22.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
일반 | 2707 | |
버섯 | 801 | 22.8% |
성명
Text
Distinct | 161 |
---|---|
Distinct (%) | 4.6% |
Missing | 2 |
Missing (%) | 0.1% |
Memory size | 27.5 KiB |
Value | Count | Frequency (%) |
김oo | 422 | 12.0% |
이oo | 321 | 9.2% |
김00 | 290 | 8.3% |
이00 | 186 | 5.3% |
박oo | 168 | 4.8% |
박00 | 128 | 3.7% |
정oo | 115 | 3.3% |
최oo | 90 | 2.6% |
조oo | 75 | 2.1% |
정00 | 72 | 2.1% |
Other values (151) | 1639 |
Most occurring characters
Value | Count | Frequency (%) |
o | 4184 | |
0 | 2825 | |
김 | 712 | 6.8% |
이 | 507 | 4.8% |
박 | 296 | 2.8% |
정 | 187 | 1.8% |
최 | 156 | 1.5% |
조 | 129 | 1.2% |
강 | 87 | 0.8% |
장 | 81 | 0.8% |
Other values (91) | 1357 | 12.9% |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 4184 | |
Other Letter | 3504 | |
Decimal Number | 2825 | |
Uppercase Letter | 7 | 0.1% |
Space Separator | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
김 | 712 | |
이 | 507 | |
박 | 296 | 8.4% |
정 | 187 | 5.3% |
최 | 156 | 4.5% |
조 | 129 | 3.7% |
강 | 87 | 2.5% |
장 | 81 | 2.3% |
윤 | 76 | 2.2% |
임 | 71 | 2.0% |
Other values (81) | 1202 |
Uppercase Letter
Value | Count | Frequency (%) |
K | 1 | |
I | 1 | |
M | 1 | |
G | 1 | |
N | 1 | |
A | 1 | |
W | 1 |
Lowercase Letter
Value | Count | Frequency (%) |
o | 4184 |
Decimal Number
Value | Count | Frequency (%) |
0 | 2825 |
Space Separator
Value | Count | Frequency (%) |
1 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 4191 | |
Hangul | 3504 | |
Common | 2826 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
김 | 712 | |
이 | 507 | |
박 | 296 | 8.4% |
정 | 187 | 5.3% |
최 | 156 | 4.5% |
조 | 129 | 3.7% |
강 | 87 | 2.5% |
장 | 81 | 2.3% |
윤 | 76 | 2.2% |
임 | 71 | 2.0% |
Other values (81) | 1202 |
Latin
Value | Count | Frequency (%) |
o | 4184 | |
K | 1 | < 0.1% |
I | 1 | < 0.1% |
M | 1 | < 0.1% |
G | 1 | < 0.1% |
N | 1 | < 0.1% |
A | 1 | < 0.1% |
W | 1 | < 0.1% |
Common
Value | Count | Frequency (%) |
0 | 2825 | |
1 | < 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 7017 | |
Hangul | 3504 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
o | 4184 | |
0 | 2825 | |
K | 1 | < 0.1% |
I | 1 | < 0.1% |
M | 1 | < 0.1% |
1 | < 0.1% | |
G | 1 | < 0.1% |
N | 1 | < 0.1% |
A | 1 | < 0.1% |
W | 1 | < 0.1% |
Hangul
Value | Count | Frequency (%) |
김 | 712 | |
이 | 507 | |
박 | 296 | 8.4% |
정 | 187 | 5.3% |
최 | 156 | 4.5% |
조 | 129 | 3.7% |
강 | 87 | 2.5% |
장 | 81 | 2.3% |
윤 | 76 | 2.2% |
임 | 71 | 2.0% |
Other values (81) | 1202 |
주소
Text
Distinct | 399 |
---|---|
Distinct (%) | 11.4% |
Missing | 1 |
Missing (%) | < 0.1% |
Memory size | 27.5 KiB |
Value | Count | Frequency (%) |
경북 | 239 | 6.7% |
전남 | 180 | 5.1% |
경기도 | 167 | 4.7% |
충남 | 150 | 4.2% |
충북 | 142 | 4.0% |
경남 | 138 | 3.9% |
경기 | 127 | 3.6% |
전북 | 98 | 2.7% |
강원 | 91 | 2.6% |
대구 | 62 | 1.7% |
Other values (240) | 2170 |
Most occurring characters
Value | Count | Frequency (%) |
2254 | ||
시 | 1130 | 9.5% |
경 | 781 | 6.6% |
남 | 575 | 4.8% |
북 | 555 | 4.7% |
군 | 482 | 4.1% |
주 | 411 | 3.5% |
전 | 398 | 3.3% |
도 | 387 | 3.3% |
충 | 361 | 3.0% |
Other values (134) | 4564 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 9643 | |
Space Separator | 2254 | 18.9% |
Decimal Number | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 1130 | 11.7% |
경 | 781 | 8.1% |
남 | 575 | 6.0% |
북 | 555 | 5.8% |
군 | 482 | 5.0% |
주 | 411 | 4.3% |
전 | 398 | 4.1% |
도 | 387 | 4.0% |
충 | 361 | 3.7% |
구 | 311 | 3.2% |
Other values (132) | 4252 |
Space Separator
Value | Count | Frequency (%) |
2254 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 9643 | |
Common | 2255 | 19.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 1130 | 11.7% |
경 | 781 | 8.1% |
남 | 575 | 6.0% |
북 | 555 | 5.8% |
군 | 482 | 5.0% |
주 | 411 | 4.3% |
전 | 398 | 4.1% |
도 | 387 | 4.0% |
충 | 361 | 3.7% |
구 | 311 | 3.2% |
Other values (132) | 4252 |
Common
Value | Count | Frequency (%) |
2254 | ||
1 | 1 | < 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 9643 | |
ASCII | 2255 | 19.0% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2254 | ||
1 | 1 | < 0.1% |
Hangul
Value | Count | Frequency (%) |
시 | 1130 | 11.7% |
경 | 781 | 8.1% |
남 | 575 | 6.0% |
북 | 555 | 5.8% |
군 | 482 | 5.0% |
주 | 411 | 4.3% |
전 | 398 | 4.1% |
도 | 387 | 4.0% |
충 | 361 | 3.7% |
구 | 311 | 3.2% |
Other values (132) | 4252 |
등록번호 | 관리품목 | 성명 | 주소 | |
---|---|---|---|---|
0 | 2022-11-003179 | 일반 | 홍00 | 포천시 |
1 | 2022-11-003178 | 일반 | 신00 | 포천시 |
2 | 2022-22-003177 | 버섯 | 이00 | 부여군 |
3 | 2022-11-003176 | 일반 | 최00 | 여주시 |
4 | 2022-11-003175 | 일반 | 김00 | 서울특별시 관악구 |
5 | 2022-11-003174 | 일반 | 김00 | 이천시 |
6 | 2022-11-003173 | 일반 | 김00 | 홍천군 |
7 | 2022-11-003172 | 일반 | 최00 | 고령군 |
8 | 2022-11-003171 | 일반 | 나00 | 서울특별시 성북구 |
9 | 2022-11-003170 | 일반 | 김00 | 홍성군 |
등록번호 | 관리품목 | 성명 | 주소 | |
---|---|---|---|---|
3498 | 1998-11-06 | 일반 | 안oo | 강원도 |
3499 | 1998-22-1 | 버섯 | 민oo | 충남 |
3500 | 1998-22-2 | 버섯 | 유oo | 충북 |
3501 | 1998-22-3 | 버섯 | 민oo | 충남 |
3502 | 1998-22-4 | 버섯 | 백oo | 충남 |
3503 | 1998-22-9 | 버섯 | 곽oo | 강원 |
3504 | 1998-22-10 | 버섯 | 송oo | 전남 |
3505 | 1998-22-11 | 버섯 | 윤oo | 전남 |
3506 | 1998-22-12 | 버섯 | 이oo | 경남 |
3507 | 1998-22-17 | 버섯 | 주oo | 전남 |
Most frequently occurring
등록번호 | 관리품목 | 성명 | 주소 | # duplicates | |
---|---|---|---|---|---|
0 | 2007-11-934 | 일반 | 박oo | 광주 | 2 |
1 | 2007-11-935 | 일반 | 박oo | 광주 | 2 |
2 | 2007-11-936 | 일반 | 김oo | 경북 | 2 |
3 | 2007-11-937 | 일반 | 양oo | 전남 | 2 |
4 | 2007-11-938 | 일반 | 서oo | 경기 | 2 |
5 | 2007-11-939 | 일반 | 박oo | 충남 | 2 |
6 | 2007-11-940 | 일반 | 현oo | 제주 | 2 |
7 | 2007-22-250 | 버섯 | 고oo | 경기 | 2 |
8 | 2007-22-251 | 버섯 | 최oo | 경기 | 2 |