Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 647 |
Missing cells | 224 |
Missing cells (%) | 8.7% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 21.0 KiB |
Average record size in memory | 33.2 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 1 |
Text | 2 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 서울시(신용보증재단) |
URL | https://bigdata.seoul.go.kr/data/selectSampleData.do?sample_data_seq=324 |
지역코드(AREA_CD) is highly overall correlated with 시도명(SIDO_NM) | High correlation |
시도명(SIDO_NM) is highly overall correlated with 지역코드(AREA_CD) | High correlation |
읍면동명(EMD_NM) has 223 (34.5%) missing values | Missing |
지역코드(AREA_CD) has unique values | Unique |
Reproduction
Analysis started | 2024-04-16 19:18:30.608341 |
---|---|
Analysis finished | 2024-04-16 19:18:31.172646 |
Duration | 0.56 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
지역코드(AREA_CD)
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 647 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 7506699.2 |
Minimum | 26110 |
---|---|
Maximum | 11740700 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 5.8 KiB |
Quantile statistics
Minimum | 26110 |
---|---|
5-th percentile | 28713 |
Q1 | 46750 |
median | 11260580 |
Q3 | 11530525 |
95-th percentile | 11710597 |
Maximum | 11740700 |
Range | 11714590 |
Interquartile range (IQR) | 11483775 |
Descriptive statistics
Standard deviation | 5420632.1 |
---|---|
Coefficient of variation (CV) | 0.72210595 |
Kurtosis | -1.5753478 |
Mean | 7506699.2 |
Median Absolute Deviation (MAD) | 360015 |
Skewness | -0.65260047 |
Sum | 4.8568344 × 109 |
Variance | 2.9383253 × 1013 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
11110515 | 1 | 0.2% |
27260 | 1 | 0.2% |
26200 | 1 | 0.2% |
26230 | 1 | 0.2% |
26260 | 1 | 0.2% |
26290 | 1 | 0.2% |
26320 | 1 | 0.2% |
26350 | 1 | 0.2% |
26380 | 1 | 0.2% |
26410 | 1 | 0.2% |
Other values (637) | 637 |
Value | Count | Frequency (%) |
26110 | 1 | |
26140 | 1 | |
26170 | 1 | |
26200 | 1 | |
26230 | 1 | |
26260 | 1 | |
26290 | 1 | |
26320 | 1 | |
26350 | 1 | |
26380 | 1 |
Value | Count | Frequency (%) |
11740700 | 1 | |
11740690 | 1 | |
11740685 | 1 | |
11740660 | 1 | |
11740650 | 1 | |
11740640 | 1 | |
11740620 | 1 | |
11740610 | 1 | |
11740600 | 1 | |
11740590 | 1 |
시도명(SIDO_NM)
Categorical
HIGH CORRELATION
 
Distinct | 17 |
---|---|
Distinct (%) | 2.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.2 KiB |
서울특별시 | |
---|---|
경기도 | 42 |
경상북도 | 23 |
전라남도 | 22 |
경상남도 | 22 |
Other values (12) |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 4.6522411 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.2% |
Sample
1st row | 서울특별시 |
---|---|
2nd row | 서울특별시 |
3rd row | 서울특별시 |
4th row | 서울특별시 |
5th row | 서울특별시 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 424 | |
경기도 | 42 | 6.5% |
경상북도 | 23 | 3.6% |
전라남도 | 22 | 3.4% |
경상남도 | 22 | 3.4% |
강원도 | 18 | 2.8% |
부산광역시 | 16 | 2.5% |
전라북도 | 15 | 2.3% |
충청남도 | 15 | 2.3% |
충청북도 | 14 | 2.2% |
Other values (7) | 36 | 5.6% |
Length
Value | Count | Frequency (%) |
서울특별시 | 424 | |
경기도 | 42 | 6.5% |
경상북도 | 23 | 3.6% |
전라남도 | 22 | 3.4% |
경상남도 | 22 | 3.4% |
강원도 | 18 | 2.8% |
부산광역시 | 16 | 2.5% |
충청남도 | 15 | 2.3% |
전라북도 | 15 | 2.3% |
충청북도 | 14 | 2.2% |
Other values (7) | 36 | 5.6% |
시군구명(SIGNGU_NM)
Text
Distinct | 225 |
---|---|
Distinct (%) | 34.8% |
Missing | 1 |
Missing (%) | 0.2% |
Memory size | 5.2 KiB |
Value | Count | Frequency (%) |
송파구 | 27 | 4.0% |
강남구 | 22 | 3.2% |
관악구 | 21 | 3.1% |
강서구 | 21 | 3.1% |
중구 | 20 | 2.9% |
성북구 | 20 | 2.9% |
노원구 | 19 | 2.8% |
강동구 | 18 | 2.7% |
서초구 | 18 | 2.7% |
영등포구 | 18 | 2.7% |
Other values (224) | 474 |
Most occurring characters
Value | Count | Frequency (%) |
구 | 519 | |
시 | 98 | 4.7% |
군 | 84 | 4.0% |
동 | 80 | 3.8% |
강 | 77 | 3.7% |
서 | 65 | 3.1% |
성 | 56 | 2.7% |
천 | 48 | 2.3% |
포 | 42 | 2.0% |
양 | 39 | 1.9% |
Other values (132) | 976 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2052 | |
Space Separator | 32 | 1.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 519 | |
시 | 98 | 4.8% |
군 | 84 | 4.1% |
동 | 80 | 3.9% |
강 | 77 | 3.8% |
서 | 65 | 3.2% |
성 | 56 | 2.7% |
천 | 48 | 2.3% |
포 | 42 | 2.0% |
양 | 39 | 1.9% |
Other values (131) | 944 |
Space Separator
Value | Count | Frequency (%) |
32 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 2052 | |
Common | 32 | 1.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 519 | |
시 | 98 | 4.8% |
군 | 84 | 4.1% |
동 | 80 | 3.9% |
강 | 77 | 3.8% |
서 | 65 | 3.2% |
성 | 56 | 2.7% |
천 | 48 | 2.3% |
포 | 42 | 2.0% |
양 | 39 | 1.9% |
Other values (131) | 944 |
Common
Value | Count | Frequency (%) |
32 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 2052 | |
ASCII | 32 | 1.5% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
구 | 519 | |
시 | 98 | 4.8% |
군 | 84 | 4.1% |
동 | 80 | 3.9% |
강 | 77 | 3.8% |
서 | 65 | 3.2% |
성 | 56 | 2.7% |
천 | 48 | 2.3% |
포 | 42 | 2.0% |
양 | 39 | 1.9% |
Other values (131) | 944 |
ASCII
Value | Count | Frequency (%) |
32 |
읍면동명(EMD_NM)
Text
MISSING
 
Distinct | 423 |
---|---|
Distinct (%) | 99.8% |
Missing | 223 |
Missing (%) | 34.5% |
Memory size | 5.2 KiB |
Value | Count | Frequency (%) |
신사동 | 2 | 0.5% |
신대방제1동 | 1 | 0.2% |
고척제1동 | 1 | 0.2% |
독산제4동 | 1 | 0.2% |
당산제2동 | 1 | 0.2% |
당산제1동 | 1 | 0.2% |
여의동 | 1 | 0.2% |
영등포동 | 1 | 0.2% |
영등포본동 | 1 | 0.2% |
시흥제5동 | 1 | 0.2% |
Other values (413) | 413 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 426 | |
제 | 183 | 10.2% |
1 | 97 | 5.4% |
2 | 97 | 5.4% |
3 | 43 | 2.4% |
신 | 38 | 2.1% |
4 | 26 | 1.5% |
가 | 23 | 1.3% |
곡 | 18 | 1.0% |
계 | 17 | 1.0% |
Other values (178) | 819 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1486 | |
Decimal Number | 292 | 16.3% |
Other Punctuation | 9 | 0.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 426 | |
제 | 183 | 12.3% |
신 | 38 | 2.6% |
가 | 23 | 1.5% |
곡 | 18 | 1.2% |
계 | 17 | 1.1% |
화 | 17 | 1.1% |
산 | 16 | 1.1% |
성 | 16 | 1.1% |
방 | 16 | 1.1% |
Other values (167) | 716 |
Decimal Number
Value | Count | Frequency (%) |
1 | 97 | |
2 | 97 | |
3 | 43 | |
4 | 26 | 8.9% |
5 | 11 | 3.8% |
6 | 7 | 2.4% |
7 | 6 | 2.1% |
8 | 3 | 1.0% |
9 | 1 | 0.3% |
0 | 1 | 0.3% |
Other Punctuation
Value | Count | Frequency (%) |
. | 9 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1486 | |
Common | 301 | 16.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 426 | |
제 | 183 | 12.3% |
신 | 38 | 2.6% |
가 | 23 | 1.5% |
곡 | 18 | 1.2% |
계 | 17 | 1.1% |
화 | 17 | 1.1% |
산 | 16 | 1.1% |
성 | 16 | 1.1% |
방 | 16 | 1.1% |
Other values (167) | 716 |
Common
Value | Count | Frequency (%) |
1 | 97 | |
2 | 97 | |
3 | 43 | |
4 | 26 | 8.6% |
5 | 11 | 3.7% |
. | 9 | 3.0% |
6 | 7 | 2.3% |
7 | 6 | 2.0% |
8 | 3 | 1.0% |
9 | 1 | 0.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1486 | |
ASCII | 301 | 16.8% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 426 | |
제 | 183 | 12.3% |
신 | 38 | 2.6% |
가 | 23 | 1.5% |
곡 | 18 | 1.2% |
계 | 17 | 1.1% |
화 | 17 | 1.1% |
산 | 16 | 1.1% |
성 | 16 | 1.1% |
방 | 16 | 1.1% |
Other values (167) | 716 |
ASCII
Value | Count | Frequency (%) |
1 | 97 | |
2 | 97 | |
3 | 43 | |
4 | 26 | 8.6% |
5 | 11 | 3.7% |
. | 9 | 3.0% |
6 | 7 | 2.3% |
7 | 6 | 2.0% |
8 | 3 | 1.0% |
9 | 1 | 0.3% |
지역코드(AREA_CD) | 시도명(SIDO_NM) | |
---|---|---|
지역코드(AREA_CD) | 1.000 | 1.000 |
시도명(SIDO_NM) | 1.000 | 1.000 |
지역코드(AREA_CD) | 시도명(SIDO_NM) | |
---|---|---|
지역코드(AREA_CD) | 1.000 | 0.988 |
시도명(SIDO_NM) | 0.988 | 1.000 |
지역코드(AREA_CD) | 시도명(SIDO_NM) | 시군구명(SIGNGU_NM) | 읍면동명(EMD_NM) | |
---|---|---|---|---|
0 | 11110515 | 서울특별시 | 종로구 | 청운효자동 |
1 | 11110530 | 서울특별시 | 종로구 | 사직동 |
2 | 11110540 | 서울특별시 | 종로구 | 삼청동 |
3 | 11110550 | 서울특별시 | 종로구 | 부암동 |
4 | 11110560 | 서울특별시 | 종로구 | 평창동 |
5 | 11110570 | 서울특별시 | 종로구 | 무악동 |
6 | 11110580 | 서울특별시 | 종로구 | 교남동 |
7 | 11110600 | 서울특별시 | 종로구 | 가회동 |
8 | 11110615 | 서울특별시 | 종로구 | 종로1.2.3.4가동 |
9 | 11110630 | 서울특별시 | 종로구 | 종로5.6가동 |
지역코드(AREA_CD) | 시도명(SIDO_NM) | 시군구명(SIGNGU_NM) | 읍면동명(EMD_NM) | |
---|---|---|---|---|
637 | 48740 | 경상남도 | 창녕군 | <NA> |
638 | 48820 | 경상남도 | 고성군 | <NA> |
639 | 48840 | 경상남도 | 남해군 | <NA> |
640 | 48850 | 경상남도 | 하동군 | <NA> |
641 | 48860 | 경상남도 | 산청군 | <NA> |
642 | 48870 | 경상남도 | 함양군 | <NA> |
643 | 48880 | 경상남도 | 거창군 | <NA> |
644 | 48890 | 경상남도 | 합천군 | <NA> |
645 | 50110 | 제주특별자치도 | 제주시 | <NA> |
646 | 50130 | 제주특별자치도 | 서귀포시 | <NA> |