Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 3220 |
Missing cells | 1 |
Missing cells (%) | < 0.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 157.4 KiB |
Average record size in memory | 50.0 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 3 |
Text | 1 |
Dataset
Description | 목포시 자연사박물관에 보유하고 있는 전시품상세정보(카테고리 대분류, 카테고리 중분류, 카테고리 소분류, 한글이름, 수량)를 제공하고 있습니다. |
---|---|
Author | 전라남도 목포시 |
URL | https://www.data.go.kr/data/15064173/fileData.do |
카테고리 대분류 is highly overall correlated with 순차번호 and 2 other fields | High correlation |
카테고리 중분류 is highly overall correlated with 순차번호 and 2 other fields | High correlation |
카테고리 소분류 is highly overall correlated with 순차번호 and 3 other fields | High correlation |
순차번호 is highly overall correlated with 카테고리 대분류 and 2 other fields | High correlation |
수량 is highly overall correlated with 카테고리 소분류 | High correlation |
순차번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 10:41:46.998670 |
---|---|
Analysis finished | 2023-12-12 10:41:48.294581 |
Duration | 1.3 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순차번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 3220 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1610.5 |
Minimum | 1 |
---|---|
Maximum | 3220 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 28.4 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 161.95 |
Q1 | 805.75 |
median | 1610.5 |
Q3 | 2415.25 |
95-th percentile | 3059.05 |
Maximum | 3220 |
Range | 3219 |
Interquartile range (IQR) | 1609.5 |
Descriptive statistics
Standard deviation | 929.67826 |
---|---|
Coefficient of variation (CV) | 0.57726064 |
Kurtosis | -1.2 |
Mean | 1610.5 |
Median Absolute Deviation (MAD) | 805 |
Skewness | 0 |
Sum | 5185810 |
Variance | 864301.67 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
2153 | 1 | < 0.1% |
2143 | 1 | < 0.1% |
2144 | 1 | < 0.1% |
2145 | 1 | < 0.1% |
2146 | 1 | < 0.1% |
2147 | 1 | < 0.1% |
2148 | 1 | < 0.1% |
2149 | 1 | < 0.1% |
2150 | 1 | < 0.1% |
Other values (3210) | 3210 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
3220 | 1 | |
3219 | 1 | |
3218 | 1 | |
3217 | 1 | |
3216 | 1 | |
3215 | 1 | |
3214 | 1 | |
3213 | 1 | |
3212 | 1 | |
3211 | 1 |
카테고리 대분류
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 25.3 KiB |
자연사박물관 | |
---|---|
문예역사관 |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 5.8378882 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 자연사박물관 |
---|---|
2nd row | 자연사박물관 |
3rd row | 자연사박물관 |
4th row | 자연사박물관 |
5th row | 자연사박물관 |
Common Values
Value | Count | Frequency (%) |
자연사박물관 | 2698 | |
문예역사관 | 522 | 16.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
자연사박물관 | 2698 | |
문예역사관 | 522 | 16.2% |
카테고리 중분류
Categorical
HIGH CORRELATION
 
Distinct | 10 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 25.3 KiB |
지질 | |
---|---|
해양생물 | |
조 · 포유류 | |
화폐 | |
오승우 | 100 |
Other values (5) |
Length
Max length | 7 |
---|---|
Median length | 6 |
Mean length | 3.5701863 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 지질 |
---|---|
2nd row | 지질 |
3rd row | 지질 |
4th row | 지질 |
5th row | 지질 |
Common Values
Value | Count | Frequency (%) |
지질 | 1142 | |
해양생물 | 1041 | |
조 · 포유류 | 515 | |
화폐 | 262 | 8.1% |
오승우 | 100 | 3.1% |
운림산방 | 67 | 2.1% |
도자기 | 43 | 1.3% |
향토작가 | 31 | 1.0% |
목물고가구 | 16 | 0.5% |
기타(조각) | 3 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
지질 | 1142 | |
해양생물 | 1041 | |
조 | 515 | |
· | 515 | |
포유류 | 515 | |
화폐 | 262 | 6.2% |
오승우 | 100 | 2.4% |
운림산방 | 67 | 1.6% |
도자기 | 43 | 1.0% |
향토작가 | 31 | 0.7% |
Other values (2) | 19 | 0.4% |
카테고리 소분류
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 25.3 KiB |
<NA> | |
---|---|
광물 | |
조류 | |
포유류 | 132 |
서양화 | 100 |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 3.013354 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 광물 |
---|---|
2nd row | 광물 |
3rd row | 광물 |
4th row | 광물 |
5th row | 광물 |
Common Values
Value | Count | Frequency (%) |
<NA> | 1463 | |
광물 | 1142 | |
조류 | 348 | 10.8% |
포유류 | 132 | 4.1% |
서양화 | 100 | 3.1% |
양서파충류 | 35 | 1.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 1463 | |
광물 | 1142 | |
조류 | 348 | 10.8% |
포유류 | 132 | 4.1% |
서양화 | 100 | 3.1% |
양서파충류 | 35 | 1.1% |
한글이름
Text
Distinct | 2285 |
---|---|
Distinct (%) | 71.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 25.3 KiB |
Value | Count | Frequency (%) |
화폐 | 187 | 4.5% |
삼엽충 | 55 | 1.3% |
원시소철류 | 54 | 1.3% |
원시 | 36 | 0.9% |
고사리류 | 29 | 0.7% |
게 | 27 | 0.7% |
인목류 | 25 | 0.6% |
신생대식물 | 22 | 0.5% |
구과류 | 17 | 0.4% |
화석 | 15 | 0.4% |
Other values (2565) | 3644 |
Most occurring characters
Value | Count | Frequency (%) |
1158 | 5.7% | |
화 | 414 | 2.0% |
리 | 406 | 2.0% |
고 | 365 | 1.8% |
i | 362 | 1.8% |
a | 359 | 1.8% |
석 | 344 | 1.7% |
이 | 331 | 1.6% |
( | 319 | 1.6% |
) | 319 | 1.6% |
Other values (738) | 15914 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 14681 | |
Lowercase Letter | 3386 | 16.7% |
Space Separator | 1158 | 5.7% |
Open Punctuation | 319 | 1.6% |
Close Punctuation | 319 | 1.6% |
Uppercase Letter | 294 | 1.4% |
Decimal Number | 62 | 0.3% |
Connector Punctuation | 49 | 0.2% |
Dash Punctuation | 18 | 0.1% |
Other Punctuation | 5 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
화 | 414 | 2.8% |
리 | 406 | 2.8% |
고 | 365 | 2.5% |
석 | 344 | 2.3% |
이 | 331 | 2.3% |
개 | 283 | 1.9% |
류 | 267 | 1.8% |
둥 | 256 | 1.7% |
기 | 214 | 1.5% |
폐 | 210 | 1.4% |
Other values (671) | 11591 |
Lowercase Letter
Value | Count | Frequency (%) |
i | 362 | |
a | 359 | |
e | 301 | 8.9% |
o | 260 | 7.7% |
s | 253 | 7.5% |
r | 243 | 7.2% |
l | 229 | 6.8% |
t | 224 | 6.6% |
n | 189 | 5.6% |
u | 167 | 4.9% |
Other values (16) | 799 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 40 | |
A | 39 | |
P | 31 | |
T | 30 | |
S | 25 | 8.5% |
D | 16 | 5.4% |
F | 16 | 5.4% |
B | 10 | 3.4% |
M | 10 | 3.4% |
H | 9 | 3.1% |
Other values (14) | 68 |
Decimal Number
Value | Count | Frequency (%) |
8 | 14 | |
1 | 11 | |
0 | 8 | |
2 | 8 | |
3 | 6 | |
9 | 4 | 6.5% |
7 | 3 | 4.8% |
4 | 3 | 4.8% |
5 | 3 | 4.8% |
6 | 2 | 3.2% |
Other Punctuation
Value | Count | Frequency (%) |
. | 3 | |
: | 2 |
Space Separator
Value | Count | Frequency (%) |
1158 |
Open Punctuation
Value | Count | Frequency (%) |
( | 319 |
Close Punctuation
Value | Count | Frequency (%) |
) | 319 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 49 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 18 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 14681 | |
Latin | 3680 | 18.1% |
Common | 1930 | 9.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
화 | 414 | 2.8% |
리 | 406 | 2.8% |
고 | 365 | 2.5% |
석 | 344 | 2.3% |
이 | 331 | 2.3% |
개 | 283 | 1.9% |
류 | 267 | 1.8% |
둥 | 256 | 1.7% |
기 | 214 | 1.5% |
폐 | 210 | 1.4% |
Other values (671) | 11591 |
Latin
Value | Count | Frequency (%) |
i | 362 | 9.8% |
a | 359 | 9.8% |
e | 301 | 8.2% |
o | 260 | 7.1% |
s | 253 | 6.9% |
r | 243 | 6.6% |
l | 229 | 6.2% |
t | 224 | 6.1% |
n | 189 | 5.1% |
u | 167 | 4.5% |
Other values (40) | 1093 |
Common
Value | Count | Frequency (%) |
1158 | ||
( | 319 | 16.5% |
) | 319 | 16.5% |
_ | 49 | 2.5% |
- | 18 | 0.9% |
8 | 14 | 0.7% |
1 | 11 | 0.6% |
0 | 8 | 0.4% |
2 | 8 | 0.4% |
3 | 6 | 0.3% |
Other values (7) | 20 | 1.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 14670 | |
ASCII | 5610 | 27.6% |
Compat Jamo | 11 | 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1158 | ||
i | 362 | 6.5% |
a | 359 | 6.4% |
( | 319 | 5.7% |
) | 319 | 5.7% |
e | 301 | 5.4% |
o | 260 | 4.6% |
s | 253 | 4.5% |
r | 243 | 4.3% |
l | 229 | 4.1% |
Other values (57) | 1807 |
Hangul
Value | Count | Frequency (%) |
화 | 414 | 2.8% |
리 | 406 | 2.8% |
고 | 365 | 2.5% |
석 | 344 | 2.3% |
이 | 331 | 2.3% |
개 | 283 | 1.9% |
류 | 267 | 1.8% |
둥 | 256 | 1.7% |
기 | 214 | 1.5% |
폐 | 210 | 1.4% |
Other values (670) | 11580 |
Compat Jamo
Value | Count | Frequency (%) |
ㅣ | 11 |
수량
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 86 |
---|---|
Distinct (%) | 2.7% |
Missing | 1 |
Missing (%) | < 0.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 5.8229264 |
Minimum | 1 |
---|---|
Maximum | 839 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 28.4 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 2 |
95-th percentile | 21 |
Maximum | 839 |
Range | 838 |
Interquartile range (IQR) | 1 |
Descriptive statistics
Standard deviation | 27.219403 |
---|---|
Coefficient of variation (CV) | 4.674523 |
Kurtosis | 425.55087 |
Mean | 5.8229264 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 17.957582 |
Sum | 18744 |
Variance | 740.89592 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 2052 | |
2 | 369 | 11.5% |
5 | 120 | 3.7% |
3 | 106 | 3.3% |
4 | 82 | 2.5% |
10 | 65 | 2.0% |
6 | 51 | 1.6% |
7 | 32 | 1.0% |
8 | 32 | 1.0% |
12 | 23 | 0.7% |
Other values (76) | 287 | 8.9% |
Value | Count | Frequency (%) |
1 | 2052 | |
2 | 369 | 11.5% |
3 | 106 | 3.3% |
4 | 82 | 2.5% |
5 | 120 | 3.7% |
6 | 51 | 1.6% |
7 | 32 | 1.0% |
8 | 32 | 1.0% |
9 | 17 | 0.5% |
10 | 65 | 2.0% |
Value | Count | Frequency (%) |
839 | 1 | |
576 | 1 | |
522 | 1 | |
518 | 1 | |
295 | 2 | |
256 | 1 | |
250 | 1 | |
200 | 1 | |
190 | 1 | |
180 | 1 |
순차번호 | 카테고리 대분류 | 카테고리 중분류 | 카테고리 소분류 | 수량 | |
---|---|---|---|---|---|
순차번호 | 1.000 | 0.989 | 0.931 | 0.836 | 0.145 |
카테고리 대분류 | 0.989 | 1.000 | 1.000 | 1.000 | 0.135 |
카테고리 중분류 | 0.931 | 1.000 | 1.000 | 1.000 | 0.117 |
카테고리 소분류 | 0.836 | 1.000 | 1.000 | 1.000 | NaN |
수량 | 0.145 | 0.135 | 0.117 | NaN | 1.000 |
카테고리 대분류 | 카테고리 중분류 | 카테고리 소분류 | |
---|---|---|---|
카테고리 대분류 | 1.000 | 0.999 | 0.999 |
카테고리 중분류 | 0.999 | 1.000 | 0.999 |
카테고리 소분류 | 0.999 | 0.999 | 1.000 |
순차번호 | 수량 | 카테고리 대분류 | 카테고리 중분류 | 카테고리 소분류 | |
---|---|---|---|---|---|
순차번호 | 1.000 | 0.415 | 0.908 | 0.567 | 0.736 |
수량 | 0.415 | 1.000 | 0.097 | 0.061 | 1.000 |
카테고리 대분류 | 0.908 | 0.097 | 1.000 | 0.999 | 0.999 |
카테고리 중분류 | 0.567 | 0.061 | 0.999 | 1.000 | 0.999 |
카테고리 소분류 | 0.736 | 1.000 | 0.999 | 0.999 | 1.000 |
순차번호 | 카테고리 대분류 | 카테고리 중분류 | 카테고리 소분류 | 한글이름 | 수량 | |
---|---|---|---|---|---|---|
0 | 1 | 자연사박물관 | 지질 | 광물 | 규석 | 55 |
1 | 2 | 자연사박물관 | 지질 | 광물 | 보크사이트 | 46 |
2 | 3 | 자연사박물관 | 지질 | 광물 | 반토혈암 | 3 |
3 | 4 | 자연사박물관 | 지질 | 광물 | 황철석 | 4 |
4 | 5 | 자연사박물관 | 지질 | 광물 | 금은혼합석 | 32 |
5 | 6 | 자연사박물관 | 지질 | 광물 | 농홍은석 | 1 |
6 | 7 | 자연사박물관 | 지질 | 광물 | 담홍은석 | 2 |
7 | 8 | 자연사박물관 | 지질 | 광물 | 취은석_자연은 | 2 |
8 | 9 | 자연사박물관 | 지질 | 광물 | 금은광 | 4 |
9 | 10 | 자연사박물관 | 지질 | 광물 | 입상회석 | 3 |
순차번호 | 카테고리 대분류 | 카테고리 중분류 | 카테고리 소분류 | 한글이름 | 수량 | |
---|---|---|---|---|---|---|
3210 | 3211 | 문예역사관 | 도자기 | <NA> | 백자장군 | 1 |
3211 | 3212 | 문예역사관 | 도자기 | <NA> | 물고기모양연적 | 1 |
3212 | 3213 | 문예역사관 | 도자기 | <NA> | 백자떡살 | 1 |
3213 | 3214 | 문예역사관 | 도자기 | <NA> | 백자떡살 | 1 |
3214 | 3215 | 문예역사관 | 도자기 | <NA> | 청화백자운학문병 | 1 |
3215 | 3216 | 문예역사관 | 도자기 | <NA> | 청화백자팔괴문다각호 | 1 |
3216 | 3217 | 문예역사관 | 도자기 | <NA> | 청화백자모란문항아리 | 1 |
3217 | 3218 | 문예역사관 | 기타(조각) | <NA> | 예술비 | 1 |
3218 | 3219 | 문예역사관 | 기타(조각) | <NA> | 파도타는 여인 | 1 |
3219 | 3220 | 문예역사관 | 기타(조각) | <NA> | 고 남농허건 애석비 | 1 |