Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 71 |
Missing cells | 30 |
Missing cells (%) | 10.6% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 2.5 KiB |
Average record size in memory | 35.9 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 1 |
Text | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 신한카드 |
URL | https://bigdata.seoul.go.kr/data/selectSampleData.do?sample_data_seq=50 |
유입지_시도코드(C_SIDO_CD) is highly overall correlated with 유입지_시도코드명(C_SIDO_NM) | High correlation |
유입지_시도코드명(C_SIDO_NM) is highly overall correlated with 유입지_시도코드(C_SIDO_CD) | High correlation |
유입지_시군구코드(C_SGG_CD) has 15 (21.1%) missing values | Missing |
유입지_시군구코드명(C_SGG_NM) has 15 (21.1%) missing values | Missing |
Reproduction
Analysis started | 2024-04-17 14:47:26.899157 |
---|---|
Analysis finished | 2024-04-17 14:47:27.511548 |
Duration | 0.61 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
유입지_시도코드(C_SIDO_CD)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 17 |
---|---|
Distinct (%) | 23.9% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 29.830986 |
Minimum | 11 |
---|---|
Maximum | 50 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 771.0 B |
Quantile statistics
Minimum | 11 |
---|---|
5-th percentile | 11 |
Q1 | 11 |
median | 41 |
Q3 | 41 |
95-th percentile | 45.5 |
Maximum | 50 |
Range | 39 |
Interquartile range (IQR) | 30 |
Descriptive statistics
Standard deviation | 14.562168 |
---|---|
Coefficient of variation (CV) | 0.48815578 |
Kurtosis | -1.6783262 |
Mean | 29.830986 |
Median Absolute Deviation (MAD) | 5 |
Skewness | -0.42692695 |
Sum | 2118 |
Variance | 212.05674 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
41 | 31 | |
11 | 25 | |
43 | 1 | 1.4% |
50 | 1 | 1.4% |
48 | 1 | 1.4% |
47 | 1 | 1.4% |
46 | 1 | 1.4% |
45 | 1 | 1.4% |
44 | 1 | 1.4% |
42 | 1 | 1.4% |
Other values (7) | 7 | 9.9% |
Value | Count | Frequency (%) |
11 | 25 | |
26 | 1 | 1.4% |
27 | 1 | 1.4% |
28 | 1 | 1.4% |
29 | 1 | 1.4% |
30 | 1 | 1.4% |
31 | 1 | 1.4% |
36 | 1 | 1.4% |
41 | 31 | |
42 | 1 | 1.4% |
Value | Count | Frequency (%) |
50 | 1 | 1.4% |
48 | 1 | 1.4% |
47 | 1 | 1.4% |
46 | 1 | 1.4% |
45 | 1 | 1.4% |
44 | 1 | 1.4% |
43 | 1 | 1.4% |
42 | 1 | 1.4% |
41 | 31 | |
36 | 1 | 1.4% |
유입지_시군구코드(C_SGG_CD)
Real number (ℝ)
MISSING
 
Distinct | 48 |
---|---|
Distinct (%) | 85.7% |
Missing | 15 |
Missing (%) | 21.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 42.053571 |
Minimum | 11 |
---|---|
Maximum | 83 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 771.0 B |
Quantile statistics
Minimum | 11 |
---|---|
5-th percentile | 13.75 |
Q1 | 25.75 |
median | 41 |
Q3 | 57.5 |
95-th percentile | 75.5 |
Maximum | 83 |
Range | 72 |
Interquartile range (IQR) | 31.75 |
Descriptive statistics
Standard deviation | 19.9047 |
---|---|
Coefficient of variation (CV) | 0.4733177 |
Kurtosis | -0.91711394 |
Mean | 42.053571 |
Median Absolute Deviation (MAD) | 16 |
Skewness | 0.25907722 |
Sum | 2355 |
Variance | 396.19708 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
29 | 2 | 2.8% |
65 | 2 | 2.8% |
59 | 2 | 2.8% |
50 | 2 | 2.8% |
41 | 2 | 2.8% |
11 | 2 | 2.8% |
21 | 2 | 2.8% |
17 | 2 | 2.8% |
26 | 1 | 1.4% |
46 | 1 | 1.4% |
Other values (38) | 38 | |
(Missing) | 15 | 21.1% |
Value | Count | Frequency (%) |
11 | 2 | |
13 | 1 | |
14 | 1 | |
15 | 1 | |
17 | 2 | |
19 | 1 | |
20 | 1 | |
21 | 2 | |
22 | 1 | |
23 | 1 |
Value | Count | Frequency (%) |
83 | 1 | |
82 | 1 | |
80 | 1 | |
74 | 1 | |
71 | 1 | |
68 | 1 | |
67 | 1 | |
65 | 2 | |
63 | 1 | |
62 | 1 |
유입지_시도코드명(C_SIDO_NM)
Categorical
HIGH CORRELATION
 
Distinct | 17 |
---|---|
Distinct (%) | 23.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 700.0 B |
경기 | |
---|---|
서울 | |
강원 | 1 |
경남 | 1 |
경북 | 1 |
Other values (12) |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 15 ? |
---|---|
Unique (%) | 21.1% |
Sample
1st row | 서울 |
---|---|
2nd row | 서울 |
3rd row | 서울 |
4th row | 서울 |
5th row | 서울 |
Common Values
Value | Count | Frequency (%) |
경기 | 31 | |
서울 | 25 | |
강원 | 1 | 1.4% |
경남 | 1 | 1.4% |
경북 | 1 | 1.4% |
전남 | 1 | 1.4% |
전북 | 1 | 1.4% |
충남 | 1 | 1.4% |
충북 | 1 | 1.4% |
부산 | 1 | 1.4% |
Other values (7) | 7 | 9.9% |
Length
Value | Count | Frequency (%) |
경기 | 31 | |
서울 | 25 | |
부산 | 1 | 1.4% |
대구 | 1 | 1.4% |
인천 | 1 | 1.4% |
광주 | 1 | 1.4% |
대전 | 1 | 1.4% |
울산 | 1 | 1.4% |
세종 | 1 | 1.4% |
충북 | 1 | 1.4% |
Other values (7) | 7 | 9.9% |
MISSING
 
Distinct | 56 |
---|---|
Distinct (%) | 100.0% |
Missing | 15 |
Missing (%) | 21.1% |
Memory size | 700.0 B |
Value | Count | Frequency (%) |
의정부시 | 1 | 1.8% |
마포구 | 1 | 1.8% |
의왕시 | 1 | 1.8% |
광명시 | 1 | 1.8% |
평택시 | 1 | 1.8% |
동두천시 | 1 | 1.8% |
안산시 | 1 | 1.8% |
고양시 | 1 | 1.8% |
과천시 | 1 | 1.8% |
구리시 | 1 | 1.8% |
Other values (46) | 46 |
Most occurring characters
Value | Count | Frequency (%) |
시 | 29 | 16.8% |
구 | 27 | 15.6% |
천 | 8 | 4.6% |
양 | 6 | 3.5% |
주 | 5 | 2.9% |
동 | 5 | 2.9% |
성 | 5 | 2.9% |
포 | 5 | 2.9% |
강 | 4 | 2.3% |
남 | 4 | 2.3% |
Other values (51) | 75 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 173 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 29 | 16.8% |
구 | 27 | 15.6% |
천 | 8 | 4.6% |
양 | 6 | 3.5% |
주 | 5 | 2.9% |
동 | 5 | 2.9% |
성 | 5 | 2.9% |
포 | 5 | 2.9% |
강 | 4 | 2.3% |
남 | 4 | 2.3% |
Other values (51) | 75 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 173 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 29 | 16.8% |
구 | 27 | 15.6% |
천 | 8 | 4.6% |
양 | 6 | 3.5% |
주 | 5 | 2.9% |
동 | 5 | 2.9% |
성 | 5 | 2.9% |
포 | 5 | 2.9% |
강 | 4 | 2.3% |
남 | 4 | 2.3% |
Other values (51) | 75 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 173 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
시 | 29 | 16.8% |
구 | 27 | 15.6% |
천 | 8 | 4.6% |
양 | 6 | 3.5% |
주 | 5 | 2.9% |
동 | 5 | 2.9% |
성 | 5 | 2.9% |
포 | 5 | 2.9% |
강 | 4 | 2.3% |
남 | 4 | 2.3% |
Other values (51) | 75 |
유입지_시도코드(C_SIDO_CD) | 유입지_시군구코드(C_SGG_CD) | 유입지_시도코드명(C_SIDO_NM) | 유입지_시군구코드명(C_SGG_NM) | |
---|---|---|---|---|
유입지_시도코드(C_SIDO_CD) | 1.000 | 0.000 | 1.000 | 1.000 |
유입지_시군구코드(C_SGG_CD) | 0.000 | 1.000 | 0.000 | 1.000 |
유입지_시도코드명(C_SIDO_NM) | 1.000 | 0.000 | 1.000 | 1.000 |
유입지_시군구코드명(C_SGG_NM) | 1.000 | 1.000 | 1.000 | 1.000 |
유입지_시도코드(C_SIDO_CD) | 유입지_시군구코드(C_SGG_CD) | 유입지_시도코드명(C_SIDO_NM) | |
---|---|---|---|
유입지_시도코드(C_SIDO_CD) | 1.000 | 0.003 | 0.926 |
유입지_시군구코드(C_SGG_CD) | 0.003 | 1.000 | 0.000 |
유입지_시도코드명(C_SIDO_NM) | 0.926 | 0.000 | 1.000 |
유입지_시도코드(C_SIDO_CD) | 유입지_시군구코드(C_SGG_CD) | 유입지_시도코드명(C_SIDO_NM) | 유입지_시군구코드명(C_SGG_NM) | |
---|---|---|---|---|
0 | 11 | 11 | 서울 | 종로구 |
1 | 11 | 14 | 서울 | 중구 |
2 | 11 | 17 | 서울 | 용산구 |
3 | 11 | 20 | 서울 | 성동구 |
4 | 11 | 21 | 서울 | 광진구 |
5 | 11 | 23 | 서울 | 동대문구 |
6 | 11 | 26 | 서울 | 중랑구 |
7 | 11 | 29 | 서울 | 성북구 |
8 | 11 | 30 | 서울 | 강북구 |
9 | 11 | 32 | 서울 | 도봉구 |
유입지_시도코드(C_SIDO_CD) | 유입지_시군구코드(C_SGG_CD) | 유입지_시도코드명(C_SIDO_NM) | 유입지_시군구코드명(C_SGG_NM) | |
---|---|---|---|---|
61 | 41 | 82 | 경기 | 가평군 |
62 | 41 | 83 | 경기 | 양평군 |
63 | 42 | <NA> | 강원 | <NA> |
64 | 43 | <NA> | 충북 | <NA> |
65 | 44 | <NA> | 충남 | <NA> |
66 | 45 | <NA> | 전북 | <NA> |
67 | 46 | <NA> | 전남 | <NA> |
68 | 47 | <NA> | 경북 | <NA> |
69 | 48 | <NA> | 경남 | <NA> |
70 | 50 | <NA> | 제주 | <NA> |