Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 385 |
Missing cells | 212 |
Missing cells (%) | 9.2% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.3% |
Total size in memory | 18.9 KiB |
Average record size in memory | 50.3 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 2 |
Text | 2 |
Dataset
Description | 경상북도내 시군청 주소 , 전화번호 등의 안내입니다(경상북도 시군의 읍면동사무소의 시군구, 읍면동, 우편번호, 주소 현황입니다.) |
---|---|
Author | 경상북도 |
URL | https://www.data.go.kr/data/15044824/fileData.do |
Dataset has 1 (0.3%) duplicate rows | Duplicates |
시군구 is highly overall correlated with 연번 and 2 other fields | High correlation |
시도 is highly overall correlated with 연번 and 2 other fields | High correlation |
연번 is highly overall correlated with 시도 and 1 other fields | High correlation |
우편번호 is highly overall correlated with 시도 and 1 other fields | High correlation |
연번 has 53 (13.8%) missing values | Missing |
읍면동 has 53 (13.8%) missing values | Missing |
우편번호 has 53 (13.8%) missing values | Missing |
주 소 has 53 (13.8%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 23:30:30.145176 |
---|---|
Analysis finished | 2023-12-12 23:30:31.143869 |
Duration | 1 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 332 |
---|---|
Distinct (%) | 100.0% |
Missing | 53 |
Missing (%) | 13.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 166.5 |
Minimum | 1 |
---|---|
Maximum | 332 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 3.5 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 17.55 |
Q1 | 83.75 |
median | 166.5 |
Q3 | 249.25 |
95-th percentile | 315.45 |
Maximum | 332 |
Range | 331 |
Interquartile range (IQR) | 165.5 |
Descriptive statistics
Standard deviation | 95.984374 |
---|---|
Coefficient of variation (CV) | 0.57648273 |
Kurtosis | -1.2 |
Mean | 166.5 |
Median Absolute Deviation (MAD) | 83 |
Skewness | 0 |
Sum | 55278 |
Variance | 9213 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
230 | 1 | 0.3% |
228 | 1 | 0.3% |
227 | 1 | 0.3% |
226 | 1 | 0.3% |
225 | 1 | 0.3% |
224 | 1 | 0.3% |
223 | 1 | 0.3% |
222 | 1 | 0.3% |
221 | 1 | 0.3% |
220 | 1 | 0.3% |
Other values (322) | 322 | |
(Missing) | 53 | 13.8% |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
332 | 1 | |
331 | 1 | |
330 | 1 | |
329 | 1 | |
328 | 1 | |
327 | 1 | |
326 | 1 | |
325 | 1 | |
324 | 1 | |
323 | 1 |
시도
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.1 KiB |
경상북도 | |
---|---|
<NA> |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 경상북도 |
---|---|
2nd row | 경상북도 |
3rd row | 경상북도 |
4th row | 경상북도 |
5th row | 경상북도 |
Common Values
Value | Count | Frequency (%) |
경상북도 | 332 | |
<NA> | 53 | 13.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
경상북도 | 332 | |
na | 53 | 13.8% |
시군구
Categorical
HIGH CORRELATION
 
Distinct | 25 |
---|---|
Distinct (%) | 6.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.1 KiB |
<NA> | |
---|---|
구미시 | |
상주시 | |
안동시 | |
경주시 | 23 |
Other values (20) |
Length
Max length | 6 |
---|---|
Median length | 3 |
Mean length | 3.425974 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 포항시 남구 |
---|---|
2nd row | 포항시 남구 |
3rd row | 포항시 남구 |
4th row | 포항시 남구 |
5th row | 포항시 남구 |
Common Values
Value | Count | Frequency (%) |
<NA> | 53 | 13.8% |
구미시 | 27 | 7.0% |
상주시 | 24 | 6.2% |
안동시 | 24 | 6.2% |
경주시 | 23 | 6.0% |
김천시 | 22 | 5.7% |
영주시 | 19 | 4.9% |
의성군 | 18 | 4.7% |
영천시 | 16 | 4.2% |
포항시 북구 | 15 | 3.9% |
Other values (15) | 144 |
Length
Value | Count | Frequency (%) |
na | 53 | 12.8% |
포항시 | 29 | 7.0% |
구미시 | 27 | 6.5% |
상주시 | 24 | 5.8% |
안동시 | 24 | 5.8% |
경주시 | 23 | 5.6% |
김천시 | 22 | 5.3% |
영주시 | 19 | 4.6% |
의성군 | 18 | 4.3% |
영천시 | 16 | 3.9% |
Other values (16) | 159 |
읍면동
Text
MISSING
 
Distinct | 327 |
---|---|
Distinct (%) | 98.5% |
Missing | 53 |
Missing (%) | 13.8% |
Memory size | 3.1 KiB |
Length
Max length | 11 |
---|---|
Median length | 10 |
Mean length | 7.8072289 |
Min length | 5 |
Characters and Unicode
Total characters | 2592 |
---|---|
Distinct characters | 184 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 322 ? |
---|---|
Unique (%) | 97.0% |
Sample
1st row | 구룡포읍행정복지센터 |
---|---|
2nd row | 연일읍행정복지센터 |
3rd row | 오천읍행정복지센터 |
4th row | 대송면행정복지센터 |
5th row | 동해면행정복지센터 |
Value | Count | Frequency (%) |
행정복지센터 | 29 | 8.0% |
화북면행정복지센터 | 2 | 0.6% |
서면사무소 | 2 | 0.6% |
북면사무소 | 2 | 0.6% |
중앙동행정복지센터 | 2 | 0.6% |
화남면행정복지센터 | 2 | 0.6% |
춘산면사무소 | 1 | 0.3% |
사곡면사무소 | 1 | 0.3% |
옥산면사무소 | 1 | 0.3% |
점곡면사무소 | 1 | 0.3% |
Other values (318) | 318 |
Most occurring characters
Value | Count | Frequency (%) |
터 | 203 | 7.8% |
센 | 203 | 7.8% |
면 | 201 | 7.8% |
지 | 176 | 6.8% |
정 | 174 | 6.7% |
행 | 170 | 6.6% |
복 | 170 | 6.6% |
사 | 133 | 5.1% |
소 | 132 | 5.1% |
무 | 130 | 5.0% |
Other values (174) | 900 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2541 | |
Space Separator | 29 | 1.1% |
Decimal Number | 22 | 0.8% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
터 | 203 | 8.0% |
센 | 203 | 8.0% |
면 | 201 | 7.9% |
지 | 176 | 6.9% |
정 | 174 | 6.8% |
행 | 170 | 6.7% |
복 | 170 | 6.7% |
사 | 133 | 5.2% |
소 | 132 | 5.2% |
무 | 130 | 5.1% |
Other values (168) | 849 |
Decimal Number
Value | Count | Frequency (%) |
2 | 9 | |
1 | 9 | |
3 | 2 | 9.1% |
5 | 1 | 4.5% |
4 | 1 | 4.5% |
Space Separator
Value | Count | Frequency (%) |
29 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 2541 | |
Common | 51 | 2.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
터 | 203 | 8.0% |
센 | 203 | 8.0% |
면 | 201 | 7.9% |
지 | 176 | 6.9% |
정 | 174 | 6.8% |
행 | 170 | 6.7% |
복 | 170 | 6.7% |
사 | 133 | 5.2% |
소 | 132 | 5.2% |
무 | 130 | 5.1% |
Other values (168) | 849 |
Common
Value | Count | Frequency (%) |
29 | ||
2 | 9 | 17.6% |
1 | 9 | 17.6% |
3 | 2 | 3.9% |
5 | 1 | 2.0% |
4 | 1 | 2.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 2541 | |
ASCII | 51 | 2.0% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
터 | 203 | 8.0% |
센 | 203 | 8.0% |
면 | 201 | 7.9% |
지 | 176 | 6.9% |
정 | 174 | 6.8% |
행 | 170 | 6.7% |
복 | 170 | 6.7% |
사 | 133 | 5.2% |
소 | 132 | 5.2% |
무 | 130 | 5.1% |
Other values (168) | 849 |
ASCII
Value | Count | Frequency (%) |
29 | ||
2 | 9 | 17.6% |
1 | 9 | 17.6% |
3 | 2 | 3.9% |
5 | 1 | 2.0% |
4 | 1 | 2.0% |
우편번호
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 331 |
---|---|
Distinct (%) | 99.7% |
Missing | 53 |
Missing (%) | 13.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 37900.244 |
Minimum | 36004 |
---|---|
Maximum | 40235 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 3.5 KiB |
Quantile statistics
Minimum | 36004 |
---|---|
5-th percentile | 36170.55 |
Q1 | 36831.75 |
median | 37674.5 |
Q3 | 39032.25 |
95-th percentile | 40041.15 |
Maximum | 40235 |
Range | 4231 |
Interquartile range (IQR) | 2200.5 |
Descriptive statistics
Standard deviation | 1242.1627 |
---|---|
Coefficient of variation (CV) | 0.03277453 |
Kurtosis | -1.1836496 |
Mean | 37900.244 |
Median Absolute Deviation (MAD) | 1024 |
Skewness | 0.27334986 |
Sum | 12582881 |
Variance | 1542968.2 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
39504 | 2 | 0.5% |
37362 | 1 | 0.3% |
37358 | 1 | 0.3% |
37348 | 1 | 0.3% |
37347 | 1 | 0.3% |
37324 | 1 | 0.3% |
37321 | 1 | 0.3% |
37327 | 1 | 0.3% |
37337 | 1 | 0.3% |
39055 | 1 | 0.3% |
Other values (321) | 321 | |
(Missing) | 53 | 13.8% |
Value | Count | Frequency (%) |
36004 | 1 | |
36008 | 1 | |
36016 | 1 | |
36030 | 1 | |
36044 | 1 | |
36050 | 1 | |
36057 | 1 | |
36068 | 1 | |
36073 | 1 | |
36089 | 1 |
Value | Count | Frequency (%) |
40235 | 1 | |
40221 | 1 | |
40211 | 1 | |
40163 | 1 | |
40152 | 1 | |
40147 | 1 | |
40136 | 1 | |
40127 | 1 | |
40123 | 1 | |
40118 | 1 |
주 소
Text
MISSING
 
Distinct | 332 |
---|---|
Distinct (%) | 100.0% |
Missing | 53 |
Missing (%) | 13.8% |
Memory size | 3.1 KiB |
Length
Max length | 27 |
---|---|
Median length | 25 |
Mean length | 19.713855 |
Min length | 14 |
Characters and Unicode
Total characters | 6545 |
---|---|
Distinct characters | 234 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 332 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 경상북도 포항시 남구 구룡포읍 호미로 133 |
---|---|
2nd row | 경상북도 포항시 남구 연일읍 철강로 10 |
3rd row | 경상북도 포항시 남구 오천읍 세계길 5 |
4th row | 경상북도 포항시 남구 대송면 장동홍계길 19 |
5th row | 경상북도 포항시 남구 동해면 일월로 66 |
Value | Count | Frequency (%) |
경상북도 | 317 | 19.9% |
포항시 | 29 | 1.8% |
구미시 | 27 | 1.7% |
안동시 | 24 | 1.5% |
상주시 | 24 | 1.5% |
경주시 | 23 | 1.4% |
김천시 | 22 | 1.4% |
영주시 | 19 | 1.2% |
의성군 | 18 | 1.1% |
영천시 | 16 | 1.0% |
Other values (787) | 1075 |
Most occurring characters
Value | Count | Frequency (%) |
1317 | ||
경 | 396 | 6.1% |
상 | 367 | 5.6% |
도 | 356 | 5.4% |
북 | 355 | 5.4% |
로 | 225 | 3.4% |
시 | 214 | 3.3% |
면 | 202 | 3.1% |
1 | 195 | 3.0% |
길 | 133 | 2.0% |
Other values (224) | 2785 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4252 | |
Space Separator | 1317 | 20.1% |
Decimal Number | 940 | 14.4% |
Dash Punctuation | 26 | 0.4% |
Close Punctuation | 5 | 0.1% |
Open Punctuation | 5 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
경 | 396 | 9.3% |
상 | 367 | 8.6% |
도 | 356 | 8.4% |
북 | 355 | 8.3% |
로 | 225 | 5.3% |
시 | 214 | 5.0% |
면 | 202 | 4.8% |
길 | 133 | 3.1% |
군 | 129 | 3.0% |
주 | 86 | 2.0% |
Other values (210) | 1789 |
Decimal Number
Value | Count | Frequency (%) |
1 | 195 | |
2 | 113 | |
3 | 107 | |
5 | 104 | |
4 | 83 | |
0 | 70 | 7.4% |
7 | 70 | 7.4% |
9 | 69 | 7.3% |
8 | 68 | 7.2% |
6 | 61 | 6.5% |
Space Separator
Value | Count | Frequency (%) |
1317 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 26 |
Close Punctuation
Value | Count | Frequency (%) |
) | 5 |
Open Punctuation
Value | Count | Frequency (%) |
( | 5 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4252 | |
Common | 2293 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
경 | 396 | 9.3% |
상 | 367 | 8.6% |
도 | 356 | 8.4% |
북 | 355 | 8.3% |
로 | 225 | 5.3% |
시 | 214 | 5.0% |
면 | 202 | 4.8% |
길 | 133 | 3.1% |
군 | 129 | 3.0% |
주 | 86 | 2.0% |
Other values (210) | 1789 |
Common
Value | Count | Frequency (%) |
1317 | ||
1 | 195 | 8.5% |
2 | 113 | 4.9% |
3 | 107 | 4.7% |
5 | 104 | 4.5% |
4 | 83 | 3.6% |
0 | 70 | 3.1% |
7 | 70 | 3.1% |
9 | 69 | 3.0% |
8 | 68 | 3.0% |
Other values (4) | 97 | 4.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4252 | |
ASCII | 2293 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1317 | ||
1 | 195 | 8.5% |
2 | 113 | 4.9% |
3 | 107 | 4.7% |
5 | 104 | 4.5% |
4 | 83 | 3.6% |
0 | 70 | 3.1% |
7 | 70 | 3.1% |
9 | 69 | 3.0% |
8 | 68 | 3.0% |
Other values (4) | 97 | 4.2% |
Hangul
Value | Count | Frequency (%) |
경 | 396 | 9.3% |
상 | 367 | 8.6% |
도 | 356 | 8.4% |
북 | 355 | 8.3% |
로 | 225 | 5.3% |
시 | 214 | 5.0% |
면 | 202 | 4.8% |
길 | 133 | 3.1% |
군 | 129 | 3.0% |
주 | 86 | 2.0% |
Other values (210) | 1789 |
연번 | 시군구 | 우편번호 | |
---|---|---|---|
연번 | 1.000 | 0.982 | 0.950 |
시군구 | 0.982 | 1.000 | 0.985 |
우편번호 | 0.950 | 0.985 | 1.000 |
시군구 | 시도 | |
---|---|---|
시군구 | 1.000 | 1.000 |
시도 | 1.000 | 1.000 |
연번 | 우편번호 | 시도 | 시군구 | |
---|---|---|---|---|
연번 | 1.000 | -0.130 | 1.000 | 0.874 |
우편번호 | -0.130 | 1.000 | 1.000 | 0.890 |
시도 | 1.000 | 1.000 | 1.000 | 1.000 |
시군구 | 0.874 | 0.890 | 1.000 | 1.000 |
연번 | 시도 | 시군구 | 읍면동 | 우편번호 | 주 소 | |
---|---|---|---|---|---|---|
0 | 1 | 경상북도 | 포항시 남구 | 구룡포읍행정복지센터 | 37936 | 경상북도 포항시 남구 구룡포읍 호미로 133 |
1 | 2 | 경상북도 | 포항시 남구 | 연일읍행정복지센터 | 37852 | 경상북도 포항시 남구 연일읍 철강로 10 |
2 | 3 | 경상북도 | 포항시 남구 | 오천읍행정복지센터 | 37912 | 경상북도 포항시 남구 오천읍 세계길 5 |
3 | 4 | 경상북도 | 포항시 남구 | 대송면행정복지센터 | 37857 | 경상북도 포항시 남구 대송면 장동홍계길 19 |
4 | 5 | 경상북도 | 포항시 남구 | 동해면행정복지센터 | 37926 | 경상북도 포항시 남구 동해면 일월로 66 |
5 | 6 | 경상북도 | 포항시 남구 | 장기면행정복지센터 | 37945 | 경상북도 포항시 남구 장기면 읍내길 99 |
6 | 7 | 경상북도 | 포항시 남구 | 호미곶면행정복지센터 | 37928 | 경상북도 포항시 남구 호미곶면 해맞이로 242 |
7 | 8 | 경상북도 | 포항시 남구 | 상대동행정복지센터 | 37766 | 경상북도 포항시 남구 상대로 98 |
8 | 9 | 경상북도 | 포항시 남구 | 해도동행정복지센터 | 37795 | 경상북도 포항시 남구 상공로 235 |
9 | 10 | 경상북도 | 포항시 남구 | 송도동행정복지센터 | 37800 | 경상북도 포항시 남구 송림로 25 |
연번 | 시도 | 시군구 | 읍면동 | 우편번호 | 주 소 | |
---|---|---|---|---|---|---|
375 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
376 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
377 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
378 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
379 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
380 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
381 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
382 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
383 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
384 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
연번 | 시도 | 시군구 | 읍면동 | 우편번호 | 주 소 | # duplicates | |
---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 53 |