Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 1310 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 22 |
Duplicate rows (%) | 1.7% |
Total size in memory | 52.6 KiB |
Average record size in memory | 41.1 B |
Variable types
Text | 1 |
---|---|
Categorical | 3 |
Numeric | 1 |
Dataset
Description | 전북특별자치도 산림박물관 전시자료 목록(물품명, 보관실 위치, 취득일자 등)전북 산림박물관이 소장한 소장품의 이름 |
---|---|
Author | 전북특별자치도 |
URL | https://www.data.go.kr/data/15055675/fileData.do |
Dataset has 22 (1.7%) duplicate rows | Duplicates |
단위 is highly overall correlated with 취득일자 | High correlation |
취득일자 is highly overall correlated with 단위 | High correlation |
단위 is highly imbalanced (55.1%) | Imbalance |
Reproduction
Analysis started | 2024-03-14 14:43:19.916813 |
---|---|
Analysis finished | 2024-03-14 14:43:21.390957 |
Duration | 1.47 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
물품명
Text
Distinct | 1115 |
---|---|
Distinct (%) | 85.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 10.4 KiB |
Value | Count | Frequency (%) |
환경스페셜 | 35 | 2.0% |
등 | 21 | 1.2% |
kbs자연다큐멘터리 | 13 | 0.7% |
pdp | 10 | 0.6% |
숲 | 8 | 0.4% |
모니터 | 8 | 0.4% |
느티나무 | 7 | 0.4% |
하회탈 | 6 | 0.3% |
나이테 | 6 | 0.3% |
스크린 | 5 | 0.3% |
Other values (1368) | 1674 |
Most occurring characters
Value | Count | Frequency (%) |
555 | 7.2% | |
0 | 226 | 2.9% |
2 | 159 | 2.1% |
리 | 153 | 2.0% |
나 | 140 | 1.8% |
1 | 128 | 1.7% |
무 | 119 | 1.6% |
이 | 117 | 1.5% |
의 | 116 | 1.5% |
기 | 112 | 1.5% |
Other values (624) | 5841 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 5945 | |
Decimal Number | 739 | 9.6% |
Space Separator | 555 | 7.2% |
Uppercase Letter | 140 | 1.8% |
Open Punctuation | 104 | 1.4% |
Close Punctuation | 104 | 1.4% |
Other Punctuation | 70 | 0.9% |
Lowercase Letter | 4 | 0.1% |
Other Symbol | 3 | < 0.1% |
Math Symbol | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
리 | 153 | 2.6% |
나 | 140 | 2.4% |
무 | 119 | 2.0% |
이 | 117 | 2.0% |
의 | 116 | 2.0% |
기 | 112 | 1.9% |
지 | 88 | 1.5% |
산 | 76 | 1.3% |
다 | 68 | 1.1% |
구 | 66 | 1.1% |
Other values (585) | 4890 |
Uppercase Letter
Value | Count | Frequency (%) |
D | 25 | |
S | 25 | |
P | 23 | |
B | 19 | |
K | 19 | |
C | 6 | 4.3% |
L | 4 | 2.9% |
V | 4 | 2.9% |
W | 3 | 2.1% |
I | 3 | 2.1% |
Other values (6) | 9 | 6.4% |
Decimal Number
Value | Count | Frequency (%) |
0 | 226 | |
2 | 159 | |
1 | 128 | |
3 | 50 | 6.8% |
6 | 36 | 4.9% |
4 | 35 | 4.7% |
5 | 35 | 4.7% |
9 | 30 | 4.1% |
8 | 22 | 3.0% |
7 | 18 | 2.4% |
Other Punctuation
Value | Count | Frequency (%) |
, | 57 | |
/ | 8 | 11.4% |
' | 2 | 2.9% |
" | 2 | 2.9% |
. | 1 | 1.4% |
Other Symbol
Value | Count | Frequency (%) |
♂ | 2 | |
♀ | 1 |
Lowercase Letter
Value | Count | Frequency (%) |
m | 2 | |
k | 2 |
Space Separator
Value | Count | Frequency (%) |
555 |
Open Punctuation
Value | Count | Frequency (%) |
( | 104 |
Close Punctuation
Value | Count | Frequency (%) |
) | 104 |
Math Symbol
Value | Count | Frequency (%) |
~ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 5943 | |
Common | 1577 | 20.6% |
Latin | 144 | 1.9% |
Han | 2 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
리 | 153 | 2.6% |
나 | 140 | 2.4% |
무 | 119 | 2.0% |
이 | 117 | 2.0% |
의 | 116 | 2.0% |
기 | 112 | 1.9% |
지 | 88 | 1.5% |
산 | 76 | 1.3% |
다 | 68 | 1.1% |
구 | 66 | 1.1% |
Other values (583) | 4888 |
Common
Value | Count | Frequency (%) |
555 | ||
0 | 226 | |
2 | 159 | 10.1% |
1 | 128 | 8.1% |
( | 104 | 6.6% |
) | 104 | 6.6% |
, | 57 | 3.6% |
3 | 50 | 3.2% |
6 | 36 | 2.3% |
4 | 35 | 2.2% |
Other values (11) | 123 | 7.8% |
Latin
Value | Count | Frequency (%) |
D | 25 | |
S | 25 | |
P | 23 | |
B | 19 | |
K | 19 | |
C | 6 | 4.2% |
L | 4 | 2.8% |
V | 4 | 2.8% |
W | 3 | 2.1% |
I | 3 | 2.1% |
Other values (8) | 13 |
Han
Value | Count | Frequency (%) |
諛 | 1 | |
個 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 5942 | |
ASCII | 1718 | 22.4% |
Misc Symbols | 3 | < 0.1% |
CJK | 2 | < 0.1% |
Compat Jamo | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
555 | ||
0 | 226 | |
2 | 159 | 9.3% |
1 | 128 | 7.5% |
( | 104 | 6.1% |
) | 104 | 6.1% |
, | 57 | 3.3% |
3 | 50 | 2.9% |
6 | 36 | 2.1% |
4 | 35 | 2.0% |
Other values (27) | 264 |
Hangul
Value | Count | Frequency (%) |
리 | 153 | 2.6% |
나 | 140 | 2.4% |
무 | 119 | 2.0% |
이 | 117 | 2.0% |
의 | 116 | 2.0% |
기 | 112 | 1.9% |
지 | 88 | 1.5% |
산 | 76 | 1.3% |
다 | 68 | 1.1% |
구 | 66 | 1.1% |
Other values (582) | 4887 |
Misc Symbols
Value | Count | Frequency (%) |
♂ | 2 | |
♀ | 1 |
CJK
Value | Count | Frequency (%) |
諛 | 1 | |
個 | 1 |
Compat Jamo
Value | Count | Frequency (%) |
ㅂ | 1 |
단위
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 11 |
---|---|
Distinct (%) | 0.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 10.4 KiB |
점 | |
---|---|
<NA> | |
마리 | |
대 | 28 |
개 | 23 |
Other values (6) | 23 |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 1.8572519 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 점 |
---|---|
2nd row | 권 |
3rd row | 권 |
4th row | 권 |
5th row | 권 |
Common Values
Value | Count | Frequency (%) |
점 | 808 | |
<NA> | 346 | |
마리 | 82 | 6.3% |
대 | 28 | 2.1% |
개 | 23 | 1.8% |
벌 | 6 | 0.5% |
권 | 5 | 0.4% |
식 | 4 | 0.3% |
편 | 4 | 0.3% |
세트 | 3 | 0.2% |
Length
Value | Count | Frequency (%) |
점 | 808 | |
na | 346 | |
마리 | 82 | 6.3% |
대 | 28 | 2.1% |
개 | 23 | 1.8% |
벌 | 6 | 0.5% |
권 | 5 | 0.4% |
식 | 4 | 0.3% |
편 | 4 | 0.3% |
세트 | 3 | 0.2% |
수량
Real number (ℝ)
Distinct | 46 |
---|---|
Distinct (%) | 3.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2.7938931 |
Minimum | 1 |
---|---|
Maximum | 182 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 11.6 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 1 |
95-th percentile | 7 |
Maximum | 182 |
Range | 181 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 9.4818532 |
---|---|
Coefficient of variation (CV) | 3.393778 |
Kurtosis | 160.27401 |
Mean | 2.7938931 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 11.066946 |
Sum | 3660 |
Variance | 89.905539 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 1048 | |
2 | 82 | 6.3% |
3 | 40 | 3.1% |
4 | 27 | 2.1% |
5 | 22 | 1.7% |
6 | 20 | 1.5% |
7 | 9 | 0.7% |
10 | 6 | 0.5% |
11 | 5 | 0.4% |
9 | 5 | 0.4% |
Other values (36) | 46 | 3.5% |
Value | Count | Frequency (%) |
1 | 1048 | |
2 | 82 | 6.3% |
3 | 40 | 3.1% |
4 | 27 | 2.1% |
5 | 22 | 1.7% |
6 | 20 | 1.5% |
7 | 9 | 0.7% |
8 | 3 | 0.2% |
9 | 5 | 0.4% |
10 | 6 | 0.5% |
Value | Count | Frequency (%) |
182 | 1 | |
149 | 1 | |
96 | 1 | |
82 | 1 | |
74 | 1 | |
69 | 1 | |
68 | 1 | |
65 | 1 | |
52 | 1 | |
51 | 1 |
취득일자
Categorical
HIGH CORRELATION
 
Distinct | 47 |
---|---|
Distinct (%) | 3.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 10.4 KiB |
2004-12-10 | |
---|---|
2001-12-01 | |
2005-11-19 | |
2004-12-01 | |
2007-12-18 | |
Other values (42) |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 10 |
Min length | 10 |
Unique
Unique | 14 ? |
---|---|
Unique (%) | 1.1% |
Sample
1st row | 2007-04-14 |
---|---|
2nd row | 2001-12-01 |
3rd row | 2001-12-01 |
4th row | 2001-12-01 |
5th row | 2001-12-01 |
Common Values
Value | Count | Frequency (%) |
2004-12-10 | 274 | |
2001-12-01 | 206 | |
2005-11-19 | 171 | |
2004-12-01 | 82 | 6.3% |
2007-12-18 | 81 | 6.2% |
2007-04-14 | 73 | 5.6% |
2007-12-24 | 69 | 5.3% |
2003-06-01 | 51 | 3.9% |
2008-12-05 | 41 | 3.1% |
2003-06-05 | 34 | 2.6% |
Other values (37) | 228 |
Length
Value | Count | Frequency (%) |
2004-12-10 | 274 | |
2001-12-01 | 206 | |
2005-11-19 | 171 | |
2004-12-01 | 82 | 6.3% |
2007-12-18 | 81 | 6.2% |
2007-04-14 | 73 | 5.6% |
2007-12-24 | 69 | 5.3% |
2003-06-01 | 51 | 3.9% |
2008-12-05 | 41 | 3.1% |
2003-06-05 | 34 | 2.6% |
Other values (37) | 228 |
보관실
Categorical
Distinct | 27 |
---|---|
Distinct (%) | 2.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 10.4 KiB |
수장고 | |
---|---|
제1전시실 | |
제4전시실 | |
제5전시실 | |
로비홀 | |
Other values (22) |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 4.0312977 |
Min length | 2 |
Unique
Unique | 9 ? |
---|---|
Unique (%) | 0.7% |
Sample
1st row | 숲속친구들 |
---|---|
2nd row | 제1전시실 |
3rd row | 제1전시실 |
4th row | 제1전시실 |
5th row | 제1전시실 |
Common Values
Value | Count | Frequency (%) |
수장고 | 361 | |
제1전시실 | 251 | |
제4전시실 | 153 | |
제5전시실 | 116 | 8.9% |
로비홀 | 103 | 7.9% |
숲속친구들 | 57 | 4.4% |
샛집 | 54 | 4.1% |
제3전시실 | 49 | 3.7% |
표본실 | 42 | 3.2% |
제2전시실 | 41 | 3.1% |
Other values (17) | 83 | 6.3% |
Length
Value | Count | Frequency (%) |
수장고 | 361 | |
제1전시실 | 251 | |
제4전시실 | 153 | |
제5전시실 | 116 | 8.8% |
로비홀 | 103 | 7.9% |
숲속친구들 | 57 | 4.3% |
샛집 | 54 | 4.1% |
제3전시실 | 49 | 3.7% |
표본실 | 42 | 3.2% |
제2전시실 | 41 | 3.1% |
Other values (17) | 84 | 6.4% |
단위 | 수량 | 취득일자 | 보관실 | |
---|---|---|---|---|
단위 | 1.000 | 0.000 | 0.880 | 0.684 |
수량 | 0.000 | 1.000 | 0.663 | 0.000 |
취득일자 | 0.880 | 0.663 | 1.000 | 0.902 |
보관실 | 0.684 | 0.000 | 0.902 | 1.000 |
단위 | 보관실 | 취득일자 | |
---|---|---|---|
단위 | 1.000 | 0.327 | 0.539 |
보관실 | 0.327 | 1.000 | 0.412 |
취득일자 | 0.539 | 0.412 | 1.000 |
수량 | 단위 | 취득일자 | 보관실 | |
---|---|---|---|---|
수량 | 1.000 | 0.000 | 0.314 | 0.000 |
단위 | 0.000 | 1.000 | 0.539 | 0.327 |
취득일자 | 0.314 | 0.539 | 1.000 | 0.412 |
보관실 | 0.000 | 0.327 | 0.412 | 1.000 |
물품명 | 단위 | 수량 | 취득일자 | 보관실 | |
---|---|---|---|---|---|
0 | 물관과 체관 | 점 | 1 | 2007-04-14 | 숲속친구들 |
1 | 고려사 | 권 | 1 | 2001-12-01 | 제1전시실 |
2 | 고려사절요 | 권 | 1 | 2001-12-01 | 제1전시실 |
3 | 고소설 | 권 | 1 | 2001-12-01 | 제1전시실 |
4 | 고암문집 | 권 | 1 | 2001-12-01 | 제1전시실 |
5 | 충재일기 | 권 | 1 | 2001-12-01 | 제1전시실 |
6 | 고서적 | 점 | 4 | 2003-06-05 | 표본실 |
7 | 백두대간사료(고서적) | 점 | 4 | 2007-04-14 | 제1전시실 |
8 | 백두대간사료(지도사본) | 점 | 2 | 2007-04-14 | 제1전시실 |
9 | 네발나비 (지층속생태) | 마리 | 1 | 2001-12-01 | 제1전시실 |
물품명 | 단위 | 수량 | 취득일자 | 보관실 | |
---|---|---|---|---|---|
1300 | 오작교 및 전통문양목교 | 점 | 5 | 2004-12-07 | 제2전시실 |
1301 | 국산재를활용한건축자재 | 점 | 36 | 2004-12-07 | 제2전시실 |
1302 | 각종 몰딩제품 및 소재 | 점 | 68 | 2004-12-07 | 제2전시실 |
1303 | 제지생산과정별 원료 등 | 점 | 42 | 2004-12-07 | 제2전시실 |
1304 | 영지버섯 외 18종 | 점 | 18 | 2001-12-01 | 제1전시실 |
1305 | 버섯표본 | 점 | 69 | 2003-06-05 | 표본실 |
1306 | 석엽표본 | 점 | 74 | 2003-12-31 | 표본실 |
1307 | 야생화 압화 | 점 | 22 | 2003-12-31 | 표본실 |
1308 | 종자표본 | 점 | 32 | 2003-06-05 | 수장고 |
1309 | 파충류 표본 | 점 | 5 | 2003-06-05 | 표본실 |
Most frequently occurring
물품명 | 단위 | 수량 | 취득일자 | 보관실 | # duplicates | |
---|---|---|---|---|---|---|
1 | PDP | <NA> | 1 | 2008-12-05 | 제1전시실 | 5 |
5 | 느티나무 | 점 | 1 | 2001-12-01 | 로비홀 | 4 |
13 | 장기알 | 점 | 1 | 2004-12-10 | 제2전시실 | 4 |
17 | 큰소쩍새 | 마리 | 2 | 2001-08-29 | 제1전시실 | 3 |
0 | KBS자연다큐멘터리 숲 (20020101) | <NA> | 1 | 2007-12-24 | 수장고 | 2 |
2 | 계류보전 | 개 | 1 | 2008-12-05 | 제1전시실 | 2 |
3 | 고누알 | 점 | 1 | 2004-12-10 | 제2전시실 | 2 |
4 | 광주리 | 점 | 2 | 2005-11-19 | 샛집 | 2 |
6 | 딱새 | 마리 | 1 | 2001-08-29 | 제1전시실 | 2 |
7 | 반닫이 | 점 | 1 | 2001-12-01 | 수장고 | 2 |