Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 52 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 3.6 KiB |
Average record size in memory | 70.5 B |
Variable types
Categorical | 5 |
---|---|
Numeric | 2 |
Text | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 빅밸류 |
URL | https://bigdata.seoul.go.kr/data/selectSampleData.do?sample_data_seq=47 |
시도명(SI_NM) has constant value "" | Constant |
시군구명(GU_NM) has constant value "" | Constant |
시도코드(SI_CD) has constant value "" | Constant |
시군구코드(GU_CD) has constant value "" | Constant |
행정동코드(HJ_CD) is highly overall correlated with 법정동코드(BJ_CD) and 1 other fields | High correlation |
법정동코드(BJ_CD) is highly overall correlated with 행정동코드(HJ_CD) and 1 other fields | High correlation |
행정동명(HJ_NM) is highly overall correlated with 행정동코드(HJ_CD) and 1 other fields | High correlation |
행정동코드(HJ_CD) has 1 (1.9%) zeros | Zeros |
법정동코드(BJ_CD) has 1 (1.9%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-10 14:58:20.434636 |
---|---|
Analysis finished | 2023-12-10 14:58:22.617156 |
Duration | 2.18 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시도명(SI_NM)
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 548.0 B |
서울 |
---|
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울 |
---|---|
2nd row | 서울 |
3rd row | 서울 |
4th row | 서울 |
5th row | 서울 |
Common Values
Value | Count | Frequency (%) |
서울 | 52 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울 | 52 |
시군구명(GU_NM)
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 548.0 B |
마포구 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 마포구 |
---|---|
2nd row | 마포구 |
3rd row | 마포구 |
4th row | 마포구 |
5th row | 마포구 |
Common Values
Value | Count | Frequency (%) |
마포구 | 52 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
마포구 | 52 |
시도코드(SI_CD)
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 548.0 B |
11 |
---|
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 11 |
---|---|
2nd row | 11 |
3rd row | 11 |
4th row | 11 |
5th row | 11 |
Common Values
Value | Count | Frequency (%) |
11 | 52 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
11 | 52 |
시군구코드(GU_CD)
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 548.0 B |
440 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 440 |
---|---|
2nd row | 440 |
3rd row | 440 |
4th row | 440 |
5th row | 440 |
Common Values
Value | Count | Frequency (%) |
440 | 52 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
440 | 52 |
행정동코드(HJ_CD)
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 23 |
---|---|
Distinct (%) | 44.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 60596.154 |
Minimum | 0 |
---|---|
Maximum | 74000 |
Zeros | 1 |
Zeros (%) | 1.9% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 600.0 B |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 53100 |
Q1 | 56500 |
median | 60000 |
Q3 | 66000 |
95-th percentile | 72450 |
Maximum | 74000 |
Range | 74000 |
Interquartile range (IQR) | 9500 |
Descriptive statistics
Standard deviation | 10363.037 |
---|---|
Coefficient of variation (CV) | 0.17101806 |
Kurtosis | 22.900992 |
Mean | 60596.154 |
Median Absolute Deviation (MAD) | 4500 |
Skewness | -3.9043176 |
Sum | 3151000 |
Variance | 1.0739253 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
59000 | 6 | 11.5% |
65500 | 5 | 9.6% |
63000 | 5 | 9.6% |
56500 | 4 | 7.7% |
67000 | 3 | 5.8% |
66000 | 3 | 5.8% |
60000 | 3 | 5.8% |
55500 | 3 | 5.8% |
56000 | 3 | 5.8% |
58500 | 2 | 3.8% |
Other values (13) | 15 |
Value | Count | Frequency (%) |
0 | 1 | 1.9% |
51000 | 1 | 1.9% |
52000 | 1 | 1.9% |
54000 | 1 | 1.9% |
55000 | 2 | 3.8% |
55500 | 3 | |
56000 | 3 | |
56500 | 4 | |
58500 | 2 | 3.8% |
59000 | 6 |
Value | Count | Frequency (%) |
74000 | 1 | 1.9% |
73000 | 2 | 3.8% |
72000 | 1 | 1.9% |
71000 | 1 | 1.9% |
70000 | 1 | 1.9% |
69000 | 1 | 1.9% |
68000 | 1 | 1.9% |
67000 | 3 | |
66000 | 3 | |
65500 | 5 |
행정동명(HJ_NM)
Categorical
HIGH CORRELATION
 
Distinct | 23 |
---|---|
Distinct (%) | 44.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 548.0 B |
용강동 | |
---|---|
신수동 | |
서강동 | |
공덕동 | |
신공덕동 | |
Other values (18) |
Length
Max length | 5 |
---|---|
Median length | 3 |
Mean length | 3.4615385 |
Min length | 3 |
Unique
Unique | 11 ? |
---|---|
Unique (%) | 21.2% |
Sample
1st row | 서강동 |
---|---|
2nd row | <NA> |
3rd row | 아현제1동 |
4th row | 아현제2동 |
5th row | 공덕제1동 |
Common Values
Value | Count | Frequency (%) |
용강동 | 6 | 11.5% |
신수동 | 5 | 9.6% |
서강동 | 5 | 9.6% |
공덕동 | 4 | 7.7% |
신공덕동 | 3 | 5.8% |
대흥동 | 3 | 5.8% |
아현동 | 3 | 5.8% |
서교동 | 3 | 5.8% |
동교동 | 3 | 5.8% |
도화동 | 2 | 3.8% |
Other values (13) | 15 |
Length
Value | Count | Frequency (%) |
용강동 | 6 | 11.5% |
서강동 | 5 | 9.6% |
신수동 | 5 | 9.6% |
공덕동 | 4 | 7.7% |
신공덕동 | 3 | 5.8% |
대흥동 | 3 | 5.8% |
아현동 | 3 | 5.8% |
서교동 | 3 | 5.8% |
동교동 | 3 | 5.8% |
성산제2동 | 2 | 3.8% |
Other values (13) | 15 |
법정동코드(BJ_CD)
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 27 |
---|---|
Distinct (%) | 51.9% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 10907.692 |
Minimum | 0 |
---|---|
Maximum | 12700 |
Zeros | 1 |
Zeros (%) | 1.9% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 600.0 B |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 10100 |
Q1 | 10400 |
median | 10900 |
Q3 | 11725 |
95-th percentile | 12500 |
Maximum | 12700 |
Range | 12700 |
Interquartile range (IQR) | 1325 |
Descriptive statistics
Standard deviation | 1736.8945 |
---|---|
Coefficient of variation (CV) | 0.15923574 |
Kurtosis | 31.264774 |
Mean | 10907.692 |
Median Absolute Deviation (MAD) | 650 |
Skewness | -4.9219606 |
Sum | 567200 |
Variance | 3016802.4 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
10200 | 5 | 9.6% |
10100 | 4 | 7.7% |
10900 | 4 | 7.7% |
10400 | 4 | 7.7% |
10800 | 3 | 5.8% |
11000 | 3 | 5.8% |
12000 | 2 | 3.8% |
11700 | 2 | 3.8% |
10300 | 2 | 3.8% |
10700 | 2 | 3.8% |
Other values (17) | 21 |
Value | Count | Frequency (%) |
0 | 1 | 1.9% |
10100 | 4 | |
10200 | 5 | |
10300 | 2 | 3.8% |
10400 | 4 | |
10500 | 1 | 1.9% |
10600 | 1 | 1.9% |
10700 | 2 | 3.8% |
10800 | 3 | |
10900 | 4 |
Value | Count | Frequency (%) |
12700 | 1 | |
12600 | 1 | |
12500 | 2 | |
12400 | 1 | |
12300 | 2 | |
12200 | 1 | |
12100 | 2 | |
12000 | 2 | |
11800 | 1 | |
11700 | 2 |
법정동명(BJ_NM)
Text
Distinct | 27 |
---|---|
Distinct (%) | 51.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 548.0 B |
Value | Count | Frequency (%) |
공덕동 | 5 | 9.6% |
도화동 | 4 | 7.7% |
아현동 | 4 | 7.7% |
염리동 | 4 | 7.7% |
대흥동 | 3 | 5.8% |
노고산동 | 3 | 5.8% |
신수동 | 2 | 3.8% |
성산동 | 2 | 3.8% |
신정동 | 2 | 3.8% |
망원동 | 2 | 3.8% |
Other values (17) | 21 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 53 | |
공 | 7 | 4.4% |
덕 | 7 | 4.4% |
신 | 6 | 3.8% |
현 | 5 | 3.1% |
산 | 5 | 3.1% |
수 | 4 | 2.5% |
교 | 4 | 2.5% |
정 | 4 | 2.5% |
아 | 4 | 2.5% |
Other values (30) | 61 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 160 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 53 | |
공 | 7 | 4.4% |
덕 | 7 | 4.4% |
신 | 6 | 3.8% |
현 | 5 | 3.1% |
산 | 5 | 3.1% |
수 | 4 | 2.5% |
교 | 4 | 2.5% |
정 | 4 | 2.5% |
아 | 4 | 2.5% |
Other values (30) | 61 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 160 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 53 | |
공 | 7 | 4.4% |
덕 | 7 | 4.4% |
신 | 6 | 3.8% |
현 | 5 | 3.1% |
산 | 5 | 3.1% |
수 | 4 | 2.5% |
교 | 4 | 2.5% |
정 | 4 | 2.5% |
아 | 4 | 2.5% |
Other values (30) | 61 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 160 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 53 | |
공 | 7 | 4.4% |
덕 | 7 | 4.4% |
신 | 6 | 3.8% |
현 | 5 | 3.1% |
산 | 5 | 3.1% |
수 | 4 | 2.5% |
교 | 4 | 2.5% |
정 | 4 | 2.5% |
아 | 4 | 2.5% |
Other values (30) | 61 |
행정동코드(HJ_CD) | 행정동명(HJ_NM) | 법정동코드(BJ_CD) | 법정동명(BJ_NM) | |
---|---|---|---|---|
행정동코드(HJ_CD) | 1.000 | 1.000 | 0.795 | 0.865 |
행정동명(HJ_NM) | 1.000 | 1.000 | 0.831 | 0.000 |
법정동코드(BJ_CD) | 0.795 | 0.831 | 1.000 | 1.000 |
법정동명(BJ_NM) | 0.865 | 0.000 | 1.000 | 1.000 |
행정동코드(HJ_CD) | 법정동코드(BJ_CD) | 행정동명(HJ_NM) | |
---|---|---|---|
행정동코드(HJ_CD) | 1.000 | 0.930 | 0.786 |
법정동코드(BJ_CD) | 0.930 | 1.000 | 0.504 |
행정동명(HJ_NM) | 0.786 | 0.504 | 1.000 |
시도명(SI_NM) | 시군구명(GU_NM) | 시도코드(SI_CD) | 시군구코드(GU_CD) | 행정동코드(HJ_CD) | 행정동명(HJ_NM) | 법정동코드(BJ_CD) | 법정동명(BJ_NM) | |
---|---|---|---|---|---|---|---|---|
0 | 서울 | 마포구 | 11 | 440 | 65500 | 서강동 | 11800 | 당인동 |
1 | 서울 | 마포구 | 11 | 440 | 0 | <NA> | 0 | 마포구 |
2 | 서울 | 마포구 | 11 | 440 | 51000 | 아현제1동 | 10100 | 아현동 |
3 | 서울 | 마포구 | 11 | 440 | 52000 | 아현제2동 | 10100 | 아현동 |
4 | 서울 | 마포구 | 11 | 440 | 54000 | 공덕제1동 | 10200 | 공덕동 |
5 | 서울 | 마포구 | 11 | 440 | 55000 | 공덕제2동 | 10200 | 공덕동 |
6 | 서울 | 마포구 | 11 | 440 | 55000 | 공덕제2동 | 10900 | 염리동 |
7 | 서울 | 마포구 | 11 | 440 | 56000 | 신공덕동 | 10200 | 공덕동 |
8 | 서울 | 마포구 | 11 | 440 | 56000 | 신공덕동 | 10300 | 신공덕동 |
9 | 서울 | 마포구 | 11 | 440 | 56000 | 신공덕동 | 10400 | 도화동 |
시도명(SI_NM) | 시군구명(GU_NM) | 시도코드(SI_CD) | 시군구코드(GU_CD) | 행정동코드(HJ_CD) | 행정동명(HJ_NM) | 법정동코드(BJ_CD) | 법정동명(BJ_NM) | |
---|---|---|---|---|---|---|---|---|
42 | 서울 | 마포구 | 11 | 440 | 67000 | 동교동 | 12000 | 서교동 |
43 | 서울 | 마포구 | 11 | 440 | 67000 | 동교동 | 12100 | 동교동 |
44 | 서울 | 마포구 | 11 | 440 | 68000 | 합정동 | 12200 | 합정동 |
45 | 서울 | 마포구 | 11 | 440 | 69000 | 망원제1동 | 12300 | 망원동 |
46 | 서울 | 마포구 | 11 | 440 | 70000 | 망원제2동 | 12300 | 망원동 |
47 | 서울 | 마포구 | 11 | 440 | 71000 | 연남동 | 12400 | 연남동 |
48 | 서울 | 마포구 | 11 | 440 | 72000 | 성산제1동 | 12500 | 성산동 |
49 | 서울 | 마포구 | 11 | 440 | 73000 | 성산제2동 | 12500 | 성산동 |
50 | 서울 | 마포구 | 11 | 440 | 73000 | 성산제2동 | 12600 | 중동 |
51 | 서울 | 마포구 | 11 | 440 | 74000 | 상암동 | 12700 | 상암동 |