Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 38 |
Missing cells | 66 |
Missing cells (%) | 34.7% |
Duplicate rows | 1 |
Duplicate rows (%) | 2.6% |
Total size in memory | 1.7 KiB |
Average record size in memory | 46.5 B |
Variable types
Numeric | 2 |
---|---|
Text | 2 |
Unsupported | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | (재)전남정보문화산업진흥원 |
URL | https://kadx.co.kr/opmk/frn/pmumkproductDetail/PMU_cea40bbf-90c0-4cc7-8c5a-3e2f392c18b1/5 |
Dataset has 1 (2.6%) duplicate rows | Duplicates |
FAMP_ID is highly overall correlated with PHT_DT | High correlation |
PHT_DT is highly overall correlated with FAMP_ID | High correlation |
FAMP_ID has 7 (18.4%) missing values | Missing |
FMLD_ADDR has 7 (18.4%) missing values | Missing |
PHT_DT has 7 (18.4%) missing values | Missing |
FILE_NM has 7 (18.4%) missing values | Missing |
IMG_URL has 38 (100.0%) missing values | Missing |
IMG_URL is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2023-12-11 20:15:10.668122 |
---|---|
Analysis finished | 2023-12-11 20:15:12.826303 |
Duration | 2.16 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
FAMP_ID
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 31 |
---|---|
Distinct (%) | 100.0% |
Missing | 7 |
Missing (%) | 18.4% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 8030339.5 |
Minimum | 3150146 |
---|---|
Maximum | 12928994 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 474.0 B |
Quantile statistics
Minimum | 3150146 |
---|---|
5-th percentile | 3394067.5 |
Q1 | 4900834.5 |
median | 7960020 |
Q3 | 10582810 |
95-th percentile | 12923684 |
Maximum | 12928994 |
Range | 9778848 |
Interquartile range (IQR) | 5681975.5 |
Descriptive statistics
Standard deviation | 3324959.2 |
---|---|
Coefficient of variation (CV) | 0.41404964 |
Kurtosis | -1.3421651 |
Mean | 8030339.5 |
Median Absolute Deviation (MAD) | 2642375 |
Skewness | 0.1275724 |
Sum | 2.4894052 × 108 |
Variance | 1.1055354 × 1013 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
4880046 | 1 | 2.6% |
10596670 | 1 | 2.6% |
6346639 | 1 | 2.6% |
12582204 | 1 | 2.6% |
10568950 | 1 | 2.6% |
6382180 | 1 | 2.6% |
3666984 | 1 | 2.6% |
3150146 | 1 | 2.6% |
12920875 | 1 | 2.6% |
12928994 | 1 | 2.6% |
Other values (21) | 21 | |
(Missing) | 7 | 18.4% |
Value | Count | Frequency (%) |
3150146 | 1 | |
3169863 | 1 | |
3618272 | 1 | |
3666984 | 1 | |
3939339 | 1 | |
4880046 | 1 | |
4880052 | 1 | |
4900543 | 1 | |
4901126 | 1 | |
6338062 | 1 |
Value | Count | Frequency (%) |
12928994 | 1 | |
12926492 | 1 | |
12920875 | 1 | |
12920266 | 1 | |
12584706 | 1 | |
12582204 | 1 | |
10602395 | 1 | |
10596670 | 1 | |
10568950 | 1 | |
10557859 | 1 |
FMLD_ADDR
Text
MISSING
 
Distinct | 31 |
---|---|
Distinct (%) | 100.0% |
Missing | 7 |
Missing (%) | 18.4% |
Memory size | 436.0 B |
Length
Max length | 27 |
---|---|
Median length | 22 |
Mean length | 22.322581 |
Min length | 20 |
Characters and Unicode
Total characters | 692 |
---|---|
Distinct characters | 93 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 31 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 경상북도 고령군 대가야읍 외리 859-7 |
---|---|
2nd row | 경상북도 영천시 화산면 용평리 331-12 |
3rd row | 경상북도 영천시 화산면 용평리 331-1 |
4th row | 경상남도 창녕군 남지읍 칠현리 4-2 |
5th row | 충청남도 서산시 성연면 해성리 184-22 |
Value | Count | Frequency (%) |
전라남도 | 9 | 5.8% |
경상남도 | 8 | 5.2% |
충청남도 | 7 | 4.5% |
서산시 | 7 | 4.5% |
경상북도 | 5 | 3.2% |
고흥군 | 5 | 3.2% |
화산면 | 4 | 2.6% |
영천시 | 4 | 2.6% |
창녕군 | 4 | 2.6% |
합천군 | 4 | 2.6% |
Other values (79) | 98 |
Most occurring characters
Value | Count | Frequency (%) |
124 | 17.9% | |
도 | 32 | 4.6% |
리 | 31 | 4.5% |
남 | 31 | 4.5% |
- | 31 | 4.5% |
면 | 24 | 3.5% |
0 | 20 | 2.9% |
군 | 18 | 2.6% |
2 | 17 | 2.5% |
1 | 16 | 2.3% |
Other values (83) | 348 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 410 | |
Decimal Number | 127 | 18.4% |
Space Separator | 124 | 17.9% |
Dash Punctuation | 31 | 4.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 32 | 7.8% |
리 | 31 | 7.6% |
남 | 31 | 7.6% |
면 | 24 | 5.9% |
군 | 18 | 4.4% |
산 | 13 | 3.2% |
상 | 13 | 3.2% |
시 | 13 | 3.2% |
서 | 13 | 3.2% |
경 | 13 | 3.2% |
Other values (71) | 209 |
Decimal Number
Value | Count | Frequency (%) |
0 | 20 | |
2 | 17 | |
1 | 16 | |
4 | 16 | |
5 | 13 | |
3 | 12 | |
7 | 12 | |
8 | 8 | 6.3% |
9 | 7 | 5.5% |
6 | 6 | 4.7% |
Space Separator
Value | Count | Frequency (%) |
124 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 31 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 410 | |
Common | 282 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 32 | 7.8% |
리 | 31 | 7.6% |
남 | 31 | 7.6% |
면 | 24 | 5.9% |
군 | 18 | 4.4% |
산 | 13 | 3.2% |
상 | 13 | 3.2% |
시 | 13 | 3.2% |
서 | 13 | 3.2% |
경 | 13 | 3.2% |
Other values (71) | 209 |
Common
Value | Count | Frequency (%) |
124 | ||
- | 31 | 11.0% |
0 | 20 | 7.1% |
2 | 17 | 6.0% |
1 | 16 | 5.7% |
4 | 16 | 5.7% |
5 | 13 | 4.6% |
3 | 12 | 4.3% |
7 | 12 | 4.3% |
8 | 8 | 2.8% |
Other values (2) | 13 | 4.6% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 410 | |
ASCII | 282 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
124 | ||
- | 31 | 11.0% |
0 | 20 | 7.1% |
2 | 17 | 6.0% |
1 | 16 | 5.7% |
4 | 16 | 5.7% |
5 | 13 | 4.6% |
3 | 12 | 4.3% |
7 | 12 | 4.3% |
8 | 8 | 2.8% |
Other values (2) | 13 | 4.6% |
Hangul
Value | Count | Frequency (%) |
도 | 32 | 7.8% |
리 | 31 | 7.6% |
남 | 31 | 7.6% |
면 | 24 | 5.9% |
군 | 18 | 4.4% |
산 | 13 | 3.2% |
상 | 13 | 3.2% |
시 | 13 | 3.2% |
서 | 13 | 3.2% |
경 | 13 | 3.2% |
Other values (71) | 209 |
PHT_DT
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 31 |
---|---|
Distinct (%) | 100.0% |
Missing | 7 |
Missing (%) | 18.4% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2.0230107 × 1013 |
Minimum | 2.0230105 × 1013 |
---|---|
Maximum | 2.0230108 × 1013 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 474.0 B |
Quantile statistics
Minimum | 2.0230105 × 1013 |
---|---|
5-th percentile | 2.0230105 × 1013 |
Q1 | 2.0230106 × 1013 |
median | 2.0230107 × 1013 |
Q3 | 2.0230107 × 1013 |
95-th percentile | 2.0230108 × 1013 |
Maximum | 2.0230108 × 1013 |
Range | 3099208 |
Interquartile range (IQR) | 1069177 |
Descriptive statistics
Standard deviation | 953394.03 |
---|---|
Coefficient of variation (CV) | 4.7127484 × 10-8 |
Kurtosis | -0.38340394 |
Mean | 2.0230107 × 1013 |
Median Absolute Deviation (MAD) | 976305 |
Skewness | -0.56483503 |
Sum | 6.2713331 × 1014 |
Variance | 9.0896018 × 1011 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20230106044912 | 1 | 2.6% |
20230108095558 | 1 | 2.6% |
20230105043701 | 1 | 2.6% |
20230107100831 | 1 | 2.6% |
20230107023803 | 1 | 2.6% |
20230107012504 | 1 | 2.6% |
20230107023658 | 1 | 2.6% |
20230106040941 | 1 | 2.6% |
20230108110739 | 1 | 2.6% |
20230108012238 | 1 | 2.6% |
Other values (21) | 21 | |
(Missing) | 7 | 18.4% |
Value | Count | Frequency (%) |
20230105012522 | 1 | |
20230105043701 | 1 | |
20230105101831 | 1 | |
20230105103317 | 1 | |
20230106013426 | 1 | |
20230106031410 | 1 | |
20230106040941 | 1 | |
20230106044713 | 1 | |
20230106044912 | 1 | |
20230107010633 | 1 |
Value | Count | Frequency (%) |
20230108111730 | 1 | |
20230108110739 | 1 | |
20230108095558 | 1 | |
20230108091004 | 1 | |
20230108085346 | 1 | |
20230108023608 | 1 | |
20230108012238 | 1 | |
20230107115435 | 1 | |
20230107112544 | 1 | |
20230107111933 | 1 |
FILE_NM
Text
MISSING
 
Distinct | 31 |
---|---|
Distinct (%) | 100.0% |
Missing | 7 |
Missing (%) | 18.4% |
Memory size | 436.0 B |
Length
Max length | 53 |
---|---|
Median length | 48 |
Mean length | 48.322581 |
Min length | 46 |
Characters and Unicode
Total characters | 1498 |
---|---|
Distinct characters | 98 |
Distinct categories | 7 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 31 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 03939339_경상북도 고령군 대가야읍 외리 859-7_230108023608.jpg |
---|---|
2nd row | 04880046_경상북도 영천시 화산면 용평리 331-12_230106044912.jpg |
3rd row | 04880052_경상북도 영천시 화산면 용평리 331-1_230106044713.jpg |
4th row | 12920266_경상남도 창녕군 남지읍 칠현리 4-2_230108111730.jpg |
5th row | 10557859_충청남도 서산시 성연면 해성리 184-22_230107010633.jpg |
Value | Count | Frequency (%) |
서산시 | 7 | 4.5% |
고흥군 | 5 | 3.2% |
영천시 | 4 | 2.6% |
화산면 | 4 | 2.6% |
창녕군 | 4 | 2.6% |
합천군 | 4 | 2.6% |
해남군 | 3 | 1.9% |
송지면 | 3 | 1.9% |
율곡면 | 3 | 1.9% |
점암면 | 3 | 1.9% |
Other values (105) | 115 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 171 | 11.4% |
124 | 8.3% | |
1 | 106 | 7.1% |
3 | 91 | 6.1% |
2 | 90 | 6.0% |
_ | 62 | 4.1% |
6 | 55 | 3.7% |
4 | 53 | 3.5% |
7 | 49 | 3.3% |
5 | 47 | 3.1% |
Other values (88) | 650 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 747 | |
Other Letter | 410 | |
Space Separator | 124 | 8.3% |
Lowercase Letter | 93 | 6.2% |
Connector Punctuation | 62 | 4.1% |
Other Punctuation | 31 | 2.1% |
Dash Punctuation | 31 | 2.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 32 | 7.8% |
남 | 31 | 7.6% |
리 | 31 | 7.6% |
면 | 24 | 5.9% |
군 | 18 | 4.4% |
서 | 13 | 3.2% |
산 | 13 | 3.2% |
시 | 13 | 3.2% |
상 | 13 | 3.2% |
경 | 13 | 3.2% |
Other values (71) | 209 |
Decimal Number
Value | Count | Frequency (%) |
0 | 171 | |
1 | 106 | |
3 | 91 | |
2 | 90 | |
6 | 55 | 7.4% |
4 | 53 | 7.1% |
7 | 49 | 6.6% |
5 | 47 | 6.3% |
9 | 43 | 5.8% |
8 | 42 | 5.6% |
Lowercase Letter
Value | Count | Frequency (%) |
g | 31 | |
p | 31 | |
j | 31 |
Space Separator
Value | Count | Frequency (%) |
124 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 62 |
Other Punctuation
Value | Count | Frequency (%) |
. | 31 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 31 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 995 | |
Hangul | 410 | |
Latin | 93 | 6.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 32 | 7.8% |
남 | 31 | 7.6% |
리 | 31 | 7.6% |
면 | 24 | 5.9% |
군 | 18 | 4.4% |
서 | 13 | 3.2% |
산 | 13 | 3.2% |
시 | 13 | 3.2% |
상 | 13 | 3.2% |
경 | 13 | 3.2% |
Other values (71) | 209 |
Common
Value | Count | Frequency (%) |
0 | 171 | |
124 | ||
1 | 106 | |
3 | 91 | |
2 | 90 | |
_ | 62 | 6.2% |
6 | 55 | 5.5% |
4 | 53 | 5.3% |
7 | 49 | 4.9% |
5 | 47 | 4.7% |
Other values (4) | 147 |
Latin
Value | Count | Frequency (%) |
g | 31 | |
p | 31 | |
j | 31 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 1088 | |
Hangul | 410 | 27.4% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 171 | |
124 | ||
1 | 106 | |
3 | 91 | 8.4% |
2 | 90 | 8.3% |
_ | 62 | 5.7% |
6 | 55 | 5.1% |
4 | 53 | 4.9% |
7 | 49 | 4.5% |
5 | 47 | 4.3% |
Other values (7) | 240 |
Hangul
Value | Count | Frequency (%) |
도 | 32 | 7.8% |
남 | 31 | 7.6% |
리 | 31 | 7.6% |
면 | 24 | 5.9% |
군 | 18 | 4.4% |
서 | 13 | 3.2% |
산 | 13 | 3.2% |
시 | 13 | 3.2% |
상 | 13 | 3.2% |
경 | 13 | 3.2% |
Other values (71) | 209 |
IMG_URL
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 38 |
---|---|
Missing (%) | 100.0% |
Memory size | 474.0 B |
FAMP_ID | FMLD_ADDR | PHT_DT | FILE_NM | |
---|---|---|---|---|
FAMP_ID | 1.000 | 1.000 | 0.536 | 1.000 |
FMLD_ADDR | 1.000 | 1.000 | 1.000 | 1.000 |
PHT_DT | 0.536 | 1.000 | 1.000 | 1.000 |
FILE_NM | 1.000 | 1.000 | 1.000 | 1.000 |
FAMP_ID | PHT_DT | |
---|---|---|
FAMP_ID | 1.000 | 0.536 |
PHT_DT | 0.536 | 1.000 |
FAMP_ID | FMLD_ADDR | PHT_DT | FILE_NM | IMG_URL | |
---|---|---|---|---|---|
0 | 3939339 | 경상북도 고령군 대가야읍 외리 859-7 | 20230108023608 | 03939339_경상북도 고령군 대가야읍 외리 859-7_230108023608.jpg | <NA> |
1 | 4880046 | 경상북도 영천시 화산면 용평리 331-12 | 20230106044912 | 04880046_경상북도 영천시 화산면 용평리 331-12_230106044912.jpg | <NA> |
2 | 4880052 | 경상북도 영천시 화산면 용평리 331-1 | 20230106044713 | 04880052_경상북도 영천시 화산면 용평리 331-1_230106044713.jpg | <NA> |
3 | 12920266 | 경상남도 창녕군 남지읍 칠현리 4-2 | 20230108111730 | 12920266_경상남도 창녕군 남지읍 칠현리 4-2_230108111730.jpg | <NA> |
4 | 10557859 | 충청남도 서산시 성연면 해성리 184-22 | 20230107010633 | 10557859_충청남도 서산시 성연면 해성리 184-22_230107010633.jpg | <NA> |
5 | 7156762 | 전라남도 신안군 안좌면 대척리 830-0 | 20230106031410 | 07156762_전라남도 신안군 안좌면 대척리 830-0_230106031410.jpg | <NA> |
6 | 12926492 | 경상남도 합천군 율곡면 율진리 423-0 | 20230107030924 | 12926492_경상남도 합천군 율곡면 율진리 423-0_230107030924.jpg | <NA> |
7 | 10602395 | 충청남도 서산시 대산읍 오지리 607-2 | 20230107035933 | 10602395_충청남도 서산시 대산읍 오지리 607-2_230107035933.jpg | <NA> |
8 | 9646141 | 제주특별자치도 서귀포시 대정읍 무릉리 2249-3 | 20230107111933 | 09646141_제주특별자치도 서귀포시 대정읍 무릉리 2249-3_230107111933.jpg | <NA> |
9 | 6370737 | 전라남도 고흥군 대서면 안남리 495-1 | 20230107105635 | 06370737_전라남도 고흥군 대서면 안남리 495-1_230107105635.jpg | <NA> |
FAMP_ID | FMLD_ADDR | PHT_DT | FILE_NM | IMG_URL | |
---|---|---|---|---|---|
28 | 12582204 | 충청남도 서산시 지곡면 무장리 145-0 | 20230107100831 | 12582204_충청남도 서산시 지곡면 무장리 145-0_230107100831.jpg | <NA> |
29 | 6346639 | 전라남도 고흥군 점암면 화계리 567-0 | 20230105043701 | 06346639_전라남도 고흥군 점암면 화계리 567-0_230105043701.jpg | <NA> |
30 | 10596670 | 충청남도 서산시 대산읍 대로리 407-0 | 20230108095558 | 10596670_충청남도 서산시 대산읍 대로리 407-0_230108095558.jpg | <NA> |
31 | <NA> | <NA> | <NA> | <NA> | <NA> |
32 | <NA> | <NA> | <NA> | <NA> | <NA> |
33 | <NA> | <NA> | <NA> | <NA> | <NA> |
34 | <NA> | <NA> | <NA> | <NA> | <NA> |
35 | <NA> | <NA> | <NA> | <NA> | <NA> |
36 | <NA> | <NA> | <NA> | <NA> | <NA> |
37 | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
FAMP_ID | FMLD_ADDR | PHT_DT | FILE_NM | # duplicates | |
---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | 7 |