Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 647 |
Missing cells (%) | 1.3% |
Duplicate rows | 599 |
Duplicate rows (%) | 6.0% |
Total size in memory | 468.8 KiB |
Average record size in memory | 48.0 B |
Variable types
Categorical | 3 |
---|---|
Text | 2 |
Dataset
Description | 지하수 기초조사 시설에 대한 내용입니다. - 구분, 관측소명, 주소, 원시자료명, 원시자료기관명 등을 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15104454/fileData.do |
구분 has constant value "" | Constant |
Dataset has 599 (6.0%) duplicate rows | Duplicates |
원시자료기관명 is highly overall correlated with 원시자료명 | High correlation |
원시자료명 is highly overall correlated with 원시자료기관명 | High correlation |
관측소명 has 647 (6.5%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 13:20:48.525851 |
---|---|
Analysis finished | 2023-12-12 13:20:49.518333 |
Duration | 0.99 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
구분
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
기초조사 |
---|
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 기초조사 |
---|---|
2nd row | 기초조사 |
3rd row | 기초조사 |
4th row | 기초조사 |
5th row | 기초조사 |
Common Values
Value | Count | Frequency (%) |
기초조사 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
기초조사 | 10000 |
관측소명
Text
MISSING
 
Distinct | 62 |
---|---|
Distinct (%) | 0.7% |
Missing | 647 |
Missing (%) | 6.5% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
인천 | 1829 | |
광주 | 1662 | |
익산 | 1009 | |
칠곡 | 875 | |
마산,진해 | 600 | 6.4% |
연기 | 513 | 5.5% |
김해 | 436 | 4.7% |
해남 | 363 | 3.9% |
신안 | 297 | 3.2% |
영덕지역 | 179 | 1.9% |
Other values (52) | 1590 |
Most occurring characters
Value | Count | Frequency (%) |
천 | 2203 | 10.2% |
산 | 1834 | 8.5% |
인 | 1829 | 8.5% |
주 | 1662 | 7.7% |
광 | 1662 | 7.7% |
해 | 1405 | 6.5% |
익 | 1009 | 4.7% |
곡 | 879 | 4.1% |
칠 | 875 | 4.0% |
진 | 628 | 2.9% |
Other values (79) | 7637 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 20831 | |
Other Punctuation | 600 | 2.8% |
Dash Punctuation | 76 | 0.4% |
Close Punctuation | 58 | 0.3% |
Open Punctuation | 58 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
천 | 2203 | 10.6% |
산 | 1834 | 8.8% |
인 | 1829 | 8.8% |
주 | 1662 | 8.0% |
광 | 1662 | 8.0% |
해 | 1405 | 6.7% |
익 | 1009 | 4.8% |
곡 | 879 | 4.2% |
칠 | 875 | 4.2% |
진 | 628 | 3.0% |
Other values (75) | 6845 |
Other Punctuation
Value | Count | Frequency (%) |
, | 600 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 76 |
Close Punctuation
Value | Count | Frequency (%) |
) | 58 |
Open Punctuation
Value | Count | Frequency (%) |
( | 58 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 20831 | |
Common | 792 | 3.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
천 | 2203 | 10.6% |
산 | 1834 | 8.8% |
인 | 1829 | 8.8% |
주 | 1662 | 8.0% |
광 | 1662 | 8.0% |
해 | 1405 | 6.7% |
익 | 1009 | 4.8% |
곡 | 879 | 4.2% |
칠 | 875 | 4.2% |
진 | 628 | 3.0% |
Other values (75) | 6845 |
Common
Value | Count | Frequency (%) |
, | 600 | |
- | 76 | 9.6% |
) | 58 | 7.3% |
( | 58 | 7.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 20831 | |
ASCII | 792 | 3.7% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
천 | 2203 | 10.6% |
산 | 1834 | 8.8% |
인 | 1829 | 8.8% |
주 | 1662 | 8.0% |
광 | 1662 | 8.0% |
해 | 1405 | 6.7% |
익 | 1009 | 4.8% |
곡 | 879 | 4.2% |
칠 | 875 | 4.2% |
진 | 628 | 3.0% |
Other values (75) | 6845 |
ASCII
Value | Count | Frequency (%) |
, | 600 | |
- | 76 | 9.6% |
) | 58 | 7.3% |
( | 58 | 7.3% |
주소
Text
Distinct | 8333 |
---|---|
Distinct (%) | 83.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 47 |
---|---|
Median length | 42 |
Mean length | 19.1766 |
Min length | 7 |
Characters and Unicode
Total characters | 191766 |
---|---|
Distinct characters | 406 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 7724 ? |
---|---|
Unique (%) | 77.2% |
Sample
1st row | 전라남도 영암군 학산면 매월리 |
---|---|
2nd row | 광주광역시 광산구 신동 334 |
3rd row | 인천광역시 강화군 송해면 |
4th row | 충청남도 연기군 서면 고복리 97-6 |
5th row | 전라북도 익산시 함라면 다망리 397 |
Value | Count | Frequency (%) |
인천광역시 | 1831 | 4.2% |
광주광역시 | 1662 | 3.8% |
경상북도 | 1515 | 3.5% |
경상남도 | 1254 | 2.9% |
전라북도 | 1180 | 2.7% |
강화군 | 1122 | 2.6% |
익산시 | 1009 | 2.3% |
전라남도 | 964 | 2.2% |
칠곡군 | 875 | 2.0% |
광산구 | 726 | 1.7% |
Other values (7500) | 31288 |
Most occurring characters
Value | Count | Frequency (%) |
40671 | ||
시 | 7017 | 3.7% |
도 | 6748 | 3.5% |
광 | 6278 | 3.3% |
리 | 6232 | 3.2% |
면 | 5235 | 2.7% |
1 | 5067 | 2.6% |
동 | 4389 | 2.3% |
군 | 4364 | 2.3% |
남 | 4253 | 2.2% |
Other values (396) | 101512 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 121397 | |
Space Separator | 40671 | 21.2% |
Decimal Number | 25799 | 13.5% |
Dash Punctuation | 3767 | 2.0% |
Open Punctuation | 56 | < 0.1% |
Close Punctuation | 54 | < 0.1% |
Other Punctuation | 10 | < 0.1% |
Uppercase Letter | 10 | < 0.1% |
Lowercase Letter | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 7017 | 5.8% |
도 | 6748 | 5.6% |
광 | 6278 | 5.2% |
리 | 6232 | 5.1% |
면 | 5235 | 4.3% |
동 | 4389 | 3.6% |
군 | 4364 | 3.6% |
남 | 4253 | 3.5% |
산 | 3833 | 3.2% |
역 | 3758 | 3.1% |
Other values (371) | 69290 |
Decimal Number
Value | Count | Frequency (%) |
1 | 5067 | |
2 | 3392 | |
3 | 2806 | |
4 | 2474 | |
5 | 2386 | |
6 | 2189 | |
7 | 2077 | |
8 | 1886 | 7.3% |
9 | 1764 | 6.8% |
0 | 1758 | 6.8% |
Uppercase Letter
Value | Count | Frequency (%) |
L | 3 | |
B | 3 | |
F | 1 | 10.0% |
A | 1 | 10.0% |
T | 1 | 10.0% |
P | 1 | 10.0% |
Other Punctuation
Value | Count | Frequency (%) |
, | 8 | |
/ | 1 | 10.0% |
. | 1 | 10.0% |
Lowercase Letter
Value | Count | Frequency (%) |
b | 1 | |
e | 1 |
Space Separator
Value | Count | Frequency (%) |
40671 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3767 |
Open Punctuation
Value | Count | Frequency (%) |
( | 56 |
Close Punctuation
Value | Count | Frequency (%) |
) | 54 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 121397 | |
Common | 70357 | |
Latin | 12 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 7017 | 5.8% |
도 | 6748 | 5.6% |
광 | 6278 | 5.2% |
리 | 6232 | 5.1% |
면 | 5235 | 4.3% |
동 | 4389 | 3.6% |
군 | 4364 | 3.6% |
남 | 4253 | 3.5% |
산 | 3833 | 3.2% |
역 | 3758 | 3.1% |
Other values (371) | 69290 |
Common
Value | Count | Frequency (%) |
40671 | ||
1 | 5067 | 7.2% |
- | 3767 | 5.4% |
2 | 3392 | 4.8% |
3 | 2806 | 4.0% |
4 | 2474 | 3.5% |
5 | 2386 | 3.4% |
6 | 2189 | 3.1% |
7 | 2077 | 3.0% |
8 | 1886 | 2.7% |
Other values (7) | 3642 | 5.2% |
Latin
Value | Count | Frequency (%) |
L | 3 | |
B | 3 | |
b | 1 | 8.3% |
e | 1 | 8.3% |
F | 1 | 8.3% |
A | 1 | 8.3% |
T | 1 | 8.3% |
P | 1 | 8.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 121397 | |
ASCII | 70369 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
40671 | ||
1 | 5067 | 7.2% |
- | 3767 | 5.4% |
2 | 3392 | 4.8% |
3 | 2806 | 4.0% |
4 | 2474 | 3.5% |
5 | 2386 | 3.4% |
6 | 2189 | 3.1% |
7 | 2077 | 3.0% |
8 | 1886 | 2.7% |
Other values (15) | 3654 | 5.2% |
Hangul
Value | Count | Frequency (%) |
시 | 7017 | 5.8% |
도 | 6748 | 5.6% |
광 | 6278 | 5.2% |
리 | 6232 | 5.1% |
면 | 5235 | 4.3% |
동 | 4389 | 3.6% |
군 | 4364 | 3.6% |
남 | 4253 | 3.5% |
산 | 3833 | 3.2% |
역 | 3758 | 3.1% |
Other values (371) | 69290 |
원시자료명
Categorical
HIGH CORRELATION
 
Distinct | 47 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
인천지역지하수기초조사 | |
---|---|
광주지역 지하수 기초조사 보고서 | |
익산지역 지하수 기초조사 | |
칠곡지역 지하수 기초조사 | |
마산,진해 지하수 기초조사 보고서 | |
Other values (42) |
Length
Max length | 33 |
---|---|
Median length | 29 |
Mean length | 15.1244 |
Min length | 11 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 영암-강진지역지하수기초조사보고서(HG-1999-YA) |
---|---|
2nd row | 광주지역 지하수 기초조사 보고서 |
3rd row | 인천지역 지하수 기초조사 |
4th row | 연기지역 지하수 기초조사 |
5th row | 익산지역 지하수 기초조사 |
Common Values
Value | Count | Frequency (%) |
인천지역지하수기초조사 | 1714 | |
광주지역 지하수 기초조사 보고서 | 1662 | |
익산지역 지하수 기초조사 | 1009 | |
칠곡지역 지하수 기초조사 | 875 | 8.8% |
마산,진해 지하수 기초조사 보고서 | 600 | 6.0% |
연기지역 지하수 기초조사 | 513 | 5.1% |
김해지역 지하수 기초조사 | 436 | 4.4% |
해남지역지하수기초조사보고서 | 363 | 3.6% |
신안지역 지하수 기초조사 | 297 | 3.0% |
영천지역 지하수 기초조사 | 278 | 2.8% |
Other values (37) | 2253 |
Length
Value | Count | Frequency (%) |
기초조사 | 6942 | |
지하수 | 6766 | |
보고서 | 2957 | |
인천지역지하수기초조사 | 1714 | 6.2% |
광주지역 | 1662 | 6.1% |
익산지역 | 1009 | 3.7% |
칠곡지역 | 875 | 3.2% |
마산,진해 | 600 | 2.2% |
연기지역 | 513 | 1.9% |
김해지역 | 436 | 1.6% |
Other values (50) | 3965 |
원시자료기관명
Categorical
HIGH CORRELATION
 
Distinct | 14 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
건설교통부,한국수자원공사 | |
---|---|
건설교통부,한국수자원공사 | |
건설교통부,한국수자원공사,대한광업진흥공사 | |
건설교통부,한국수자원공사,대한공업진흥공사 | |
건설교통부,대한광업진흥공사 | |
Other values (9) |
Length
Max length | 23 |
---|---|
Median length | 22 |
Mean length | 15.6107 |
Min length | 7 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 한국자원연구소 |
---|---|
2nd row | 건설교통부,한국수자원공사 |
3rd row | 건설교통부,한국수자원공사 |
4th row | 건설교통부,한국수자원공사,한국농촌공사 |
5th row | 건설교통부,한국수자원공사,대한광업진흥공사 |
Common Values
Value | Count | Frequency (%) |
건설교통부,한국수자원공사 | 3589 | |
건설교통부,한국수자원공사 | 1662 | |
건설교통부,한국수자원공사,대한광업진흥공사 | 1045 | 10.4% |
건설교통부,한국수자원공사,대한공업진흥공사 | 600 | 6.0% |
건설교통부,대한광업진흥공사 | 529 | 5.3% |
건설교통부,한국수자원공사,한국지질자원연구원 | 521 | 5.2% |
건설교통부,한국수자원공사,한국농촌공사 | 513 | 5.1% |
한국자원연구소 | 483 | 4.8% |
건설교통부,한국수자원공사,농업기반공사 | 436 | 4.4% |
한국수자원공사 | 319 | 3.2% |
Other values (4) | 303 | 3.0% |
Length
Value | Count | Frequency (%) |
건설교통부,한국수자원공사 | 5251 | |
건설교통부,한국수자원공사,대한광업진흥공사 | 1278 | 12.8% |
건설교통부,한국수자원공사,대한공업진흥공사 | 600 | 6.0% |
건설교통부,대한광업진흥공사 | 529 | 5.3% |
건설교통부,한국수자원공사,한국지질자원연구원 | 521 | 5.2% |
건설교통부,한국수자원공사,한국농촌공사 | 513 | 5.1% |
한국자원연구소 | 483 | 4.8% |
건설교통부,한국수자원공사,농업기반공사 | 436 | 4.4% |
한국수자원공사 | 319 | 3.2% |
한국동력자원연구소 | 64 | 0.6% |
Other values (2) | 6 | 0.1% |
관측소명 | 원시자료명 | 원시자료기관명 | |
---|---|---|---|
관측소명 | 1.000 | 1.000 | 1.000 |
원시자료명 | 1.000 | 1.000 | 1.000 |
원시자료기관명 | 1.000 | 1.000 | 1.000 |
원시자료기관명 | 원시자료명 | |
---|---|---|
원시자료기관명 | 1.000 | 0.998 |
원시자료명 | 0.998 | 1.000 |
원시자료명 | 원시자료기관명 | |
---|---|---|
원시자료명 | 1.000 | 0.998 |
원시자료기관명 | 0.998 | 1.000 |
구분 | 관측소명 | 주소 | 원시자료명 | 원시자료기관명 | |
---|---|---|---|---|---|
5420 | 기초조사 | <NA> | 전라남도 영암군 학산면 매월리 | 영암-강진지역지하수기초조사보고서(HG-1999-YA) | 한국자원연구소 |
24108 | 기초조사 | 광주 | 광주광역시 광산구 신동 334 | 광주지역 지하수 기초조사 보고서 | 건설교통부,한국수자원공사 |
37220 | 기초조사 | 인천 | 인천광역시 강화군 송해면 | 인천지역 지하수 기초조사 | 건설교통부,한국수자원공사 |
16173 | 기초조사 | 연기 | 충청남도 연기군 서면 고복리 97-6 | 연기지역 지하수 기초조사 | 건설교통부,한국수자원공사,한국농촌공사 |
35974 | 기초조사 | 익산 | 전라북도 익산시 함라면 다망리 397 | 익산지역 지하수 기초조사 | 건설교통부,한국수자원공사,대한광업진흥공사 |
12444 | 기초조사 | 포항 | 경상북도 포항시 신광면 냉수1리 258-2 | 포항지역 지하수 기초조사 | 건설교통부,한국수자원공사 |
23696 | 기초조사 | 광주 | 광주광역시 서구 덕흥동 811-4 | 광주지역 지하수 기초조사 보고서 | 건설교통부,한국수자원공사 |
35910 | 기초조사 | 인천 | 인천광역시 강화군 송해면 솔정리 687-2 | 인천지역지하수기초조사 | 건설교통부,한국수자원공사 |
53515 | 기초조사 | 인천 | 인천광역시 중구 남북동 637 | 인천지역지하수기초조사 | 건설교통부,한국수자원공사 |
53657 | 기초조사 | 인천 | 인천광역시 강화군 강화읍 월곳리 577-1 | 인천지역지하수기초조사 | 건설교통부,한국수자원공사 |
구분 | 관측소명 | 주소 | 원시자료명 | 원시자료기관명 | |
---|---|---|---|---|---|
43001 | 기초조사 | 인천 | 인천광역시 강화군 길상면 길직리 583-4 | 인천지역지하수기초조사 | 건설교통부,한국수자원공사 |
54221 | 기초조사 | 인천 | 인천광역시 강화군 강화읍 국화리 650 | 인천지역지하수기초조사 | 건설교통부,한국수자원공사 |
29105 | 기초조사 | 광주 | 광주광역시 서구 농성동 481-24 | 광주지역 지하수 기초조사 보고서 | 건설교통부,한국수자원공사 |
62076 | 기초조사 | 김해 | 경상남도 김해시 대동면 대감리 | 김해지역 지하수 기초조사 | 건설교통부,한국수자원공사,농업기반공사 |
45421 | 기초조사 | 칠곡 | 경상북도 칠곡군 왜관읍 매원리 696-3 | 칠곡지역 지하수 기초조사 | 건설교통부,한국수자원공사 |
25683 | 기초조사 | 마산,진해 | 경상남도 진해시 남양동 69번지 | 마산,진해 지하수 기초조사 보고서 | 건설교통부,한국수자원공사,대한공업진흥공사 |
40660 | 기초조사 | 인천 | 인천광역시 강화군 길상면 선두리 970-1 | 인천지역지하수기초조사 | 건설교통부,한국수자원공사 |
52387 | 기초조사 | 인천 | 인천광역시 강화군 강화읍 대산리 1269 | 인천지역지하수기초조사 | 건설교통부,한국수자원공사 |
3561 | 기초조사 | 해남 | 전라남도 해남군 | 해남지역지하수기초조사보고서 | 건설교통부,대한광업진흥공사 |
44825 | 기초조사 | 익산 | 전라북도 익산시 금마면 신용리 696 | 익산지역 지하수 기초조사 | 건설교통부,한국수자원공사,대한광업진흥공사 |
Most frequently occurring
구분 | 관측소명 | 주소 | 원시자료명 | 원시자료기관명 | # duplicates | |
---|---|---|---|---|---|---|
505 | 기초조사 | 해남 | 전라남도 해남군 | 해남지역지하수기초조사보고서 | 건설교통부,대한광업진흥공사 | 328 |
349 | 기초조사 | 익산 | 전라북도 익산시 | 익산지역 지하수 기초조사 | 건설교통부,한국수자원공사,대한광업진흥공사 | 38 |
207 | 기초조사 | 신안 | 전라남도 신안군 압해면 복용리 | 신안지역 지하수 기초조사 | 건설교통부,한국수자원공사,한국지질자원연구원 | 28 |
0 | 기초조사 | 가남 | 경기도 | 한국수문지질도및보고서 가남지역(양화천유역) | 한국자원연구소 | 25 |
206 | 기초조사 | 신안 | 전라남도 신안군 압해면 동서리 | 신안지역 지하수 기초조사 | 건설교통부,한국수자원공사,한국지질자원연구원 | 24 |
193 | 기초조사 | 신안 | 전라남도 신안군 | 신안지역 지하수 기초조사 | 건설교통부,한국수자원공사,한국지질자원연구원 | 22 |
513 | 기초조사 | <NA> | 경상남도 거창군 거창읍 서변리 | 거창지역 지하수 기초조사 보고서 | 건설교통부,대한광업진흥공사 | 22 |
470 | 기초조사 | 칠곡 | 경상북도 칠곡군 약목면 덕산리 | 칠곡지역 지하수 기초조사 | 건설교통부,한국수자원공사 | 19 |
439 | 기초조사 | 칠곡 | 경상북도 칠곡군 기산면 영리 | 칠곡지역 지하수 기초조사 | 건설교통부,한국수자원공사 | 16 |
442 | 기초조사 | 칠곡 | 경상북도 칠곡군 기산면 행정리 | 칠곡지역 지하수 기초조사 | 건설교통부,한국수자원공사 | 16 |