Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 30 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.6 KiB |
Average record size in memory | 54.4 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 2 |
Text | 2 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 전자가족관계등록시스템(대법원) |
URL | https://bigdata.seoul.go.kr/data/selectSampleData.do?sample_data_seq=62 |
시도명(ctprvn_nm) has constant value "" | Constant |
Reproduction
Analysis started | 2024-01-14 06:50:03.975117 |
---|---|
Analysis finished | 2024-01-14 06:50:06.339367 |
Duration | 2.36 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
조회기간(inqire_ym)
Real number (ℝ)
Distinct | 25 |
---|---|
Distinct (%) | 83.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 201807.5 |
Minimum | 201504 |
---|---|
Maximum | 202104 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 402.0 B |
Quantile statistics
Minimum | 201504 |
---|---|
5-th percentile | 201509.25 |
Q1 | 201707.5 |
median | 201810.5 |
Q3 | 201911.5 |
95-th percentile | 202011.55 |
Maximum | 202104 |
Range | 600 |
Interquartile range (IQR) | 204 |
Descriptive statistics
Standard deviation | 172.46304 |
---|---|
Coefficient of variation (CV) | 0.00085459182 |
Kurtosis | -0.96333472 |
Mean | 201807.5 |
Median Absolute Deviation (MAD) | 102.5 |
Skewness | -0.26573558 |
Sum | 6054225 |
Variance | 29743.5 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
201906 | 3 | 10.0% |
202011 | 3 | 10.0% |
201709 | 2 | 6.7% |
201804 | 1 | 3.3% |
202012 | 1 | 3.3% |
201910 | 1 | 3.3% |
202104 | 1 | 3.3% |
201912 | 1 | 3.3% |
201806 | 1 | 3.3% |
202004 | 1 | 3.3% |
Other values (15) | 15 |
Value | Count | Frequency (%) |
201504 | 1 | |
201507 | 1 | |
201512 | 1 | |
201601 | 1 | |
201603 | 1 | |
201608 | 1 | |
201609 | 1 | |
201707 | 1 | |
201709 | 2 | |
201712 | 1 |
Value | Count | Frequency (%) |
202104 | 1 | 3.3% |
202012 | 1 | 3.3% |
202011 | 3 | |
202004 | 1 | 3.3% |
202003 | 1 | 3.3% |
201912 | 1 | 3.3% |
201910 | 1 | 3.3% |
201906 | 3 | |
201903 | 1 | 3.3% |
201812 | 1 | 3.3% |
시도명(ctprvn_nm)
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 3.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
서울특별시 |
---|
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 5 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울특별시 |
---|---|
2nd row | 서울특별시 |
3rd row | 서울특별시 |
4th row | 서울특별시 |
5th row | 서울특별시 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 30 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울특별시 | 30 |
시군구(signgu_nm)
Text
Distinct | 16 |
---|---|
Distinct (%) | 53.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
Length
Max length | 14 |
---|---|
Median length | 9 |
Mean length | 9.3333333 |
Min length | 8 |
Characters and Unicode
Total characters | 280 |
---|---|
Distinct characters | 41 |
Distinct categories | 2 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 7 ? |
---|---|
Unique (%) | 23.3% |
Sample
1st row | 서울특별시 중구 |
---|---|
2nd row | 서울특별시 서대문구 |
3rd row | 서울특별시 동작구 |
4th row | 서울특별시 강남구 |
5th row | 서울특별시 관악구 |
Value | Count | Frequency (%) |
서울특별시 | 29 | |
영등포구 | 4 | 6.7% |
성북구 | 4 | 6.7% |
은평구 | 3 | 5.0% |
마포구 | 2 | 3.3% |
종로구 | 2 | 3.3% |
성동구 | 2 | 3.3% |
관악구 | 2 | 3.3% |
동작구 | 2 | 3.3% |
서대문구 | 2 | 3.3% |
Other values (8) | 8 | 13.3% |
Most occurring characters
Value | Count | Frequency (%) |
서 | 33 | |
30 | ||
울 | 29 | |
특 | 29 | |
별 | 29 | |
시 | 29 | |
구 | 29 | |
성 | 6 | 2.1% |
포 | 6 | 2.1% |
등 | 5 | 1.8% |
Other values (31) | 55 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 250 | |
Space Separator | 30 | 10.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
서 | 33 | |
울 | 29 | |
특 | 29 | |
별 | 29 | |
시 | 29 | |
구 | 29 | |
성 | 6 | 2.4% |
포 | 6 | 2.4% |
등 | 5 | 2.0% |
영 | 4 | 1.6% |
Other values (30) | 51 |
Space Separator
Value | Count | Frequency (%) |
30 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 250 | |
Common | 30 | 10.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
서 | 33 | |
울 | 29 | |
특 | 29 | |
별 | 29 | |
시 | 29 | |
구 | 29 | |
성 | 6 | 2.4% |
포 | 6 | 2.4% |
등 | 5 | 2.0% |
영 | 4 | 1.6% |
Other values (30) | 51 |
Common
Value | Count | Frequency (%) |
30 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 250 | |
ASCII | 30 | 10.7% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
서 | 33 | |
울 | 29 | |
특 | 29 | |
별 | 29 | |
시 | 29 | |
구 | 29 | |
성 | 6 | 2.4% |
포 | 6 | 2.4% |
등 | 5 | 2.0% |
영 | 4 | 1.6% |
Other values (30) | 51 |
ASCII
Value | Count | Frequency (%) |
30 |
구청명(emd_nm)
Text
Distinct | 19 |
---|---|
Distinct (%) | 63.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
Length
Max length | 11 |
---|---|
Median length | 10 |
Mean length | 10.066667 |
Min length | 9 |
Characters and Unicode
Total characters | 302 |
---|---|
Distinct characters | 35 |
Distinct categories | 2 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 8 ? |
---|---|
Unique (%) | 26.7% |
Sample
1st row | 서울특별시 중구청 |
---|---|
2nd row | 서울특별시 강서구청 |
3rd row | 서울특별시 동작구청 |
4th row | 서울특별시 성동구청 |
5th row | 서울특별시 서대문구청 |
Value | Count | Frequency (%) |
서울특별시 | 30 | |
도봉구청 | 2 | 3.3% |
동작구청 | 2 | 3.3% |
강남구청 | 2 | 3.3% |
서대문구청 | 2 | 3.3% |
금천구청 | 2 | 3.3% |
성동구청 | 2 | 3.3% |
은평구청 | 2 | 3.3% |
강서구청 | 2 | 3.3% |
관악구청 | 2 | 3.3% |
Other values (10) | 12 | 20.0% |
Most occurring characters
Value | Count | Frequency (%) |
서 | 35 | |
구 | 32 | |
시 | 30 | |
30 | ||
청 | 30 | |
별 | 30 | |
특 | 30 | |
울 | 30 | |
강 | 6 | 2.0% |
동 | 5 | 1.7% |
Other values (25) | 44 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 272 | |
Space Separator | 30 | 9.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
서 | 35 | |
구 | 32 | |
시 | 30 | |
청 | 30 | |
별 | 30 | |
특 | 30 | |
울 | 30 | |
강 | 6 | 2.2% |
동 | 5 | 1.8% |
중 | 3 | 1.1% |
Other values (24) | 41 |
Space Separator
Value | Count | Frequency (%) |
30 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 272 | |
Common | 30 | 9.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
서 | 35 | |
구 | 32 | |
시 | 30 | |
청 | 30 | |
별 | 30 | |
특 | 30 | |
울 | 30 | |
강 | 6 | 2.2% |
동 | 5 | 1.8% |
중 | 3 | 1.1% |
Other values (24) | 41 |
Common
Value | Count | Frequency (%) |
30 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 272 | |
ASCII | 30 | 9.9% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
서 | 35 | |
구 | 32 | |
시 | 30 | |
청 | 30 | |
별 | 30 | |
특 | 30 | |
울 | 30 | |
강 | 6 | 2.2% |
동 | 5 | 1.8% |
중 | 3 | 1.1% |
Other values (24) | 41 |
ASCII
Value | Count | Frequency (%) |
30 |
건수(managt_cnt)
Real number (ℝ)
Distinct | 16 |
---|---|
Distinct (%) | 53.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 22.166667 |
Minimum | 2 |
---|---|
Maximum | 374 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 402.0 B |
Quantile statistics
Minimum | 2 |
---|---|
5-th percentile | 2.45 |
Q1 | 7 |
median | 10 |
Q3 | 12.75 |
95-th percentile | 25.4 |
Maximum | 374 |
Range | 372 |
Interquartile range (IQR) | 5.75 |
Descriptive statistics
Standard deviation | 66.676824 |
---|---|
Coefficient of variation (CV) | 3.007977 |
Kurtosis | 29.551373 |
Mean | 22.166667 |
Median Absolute Deviation (MAD) | 3 |
Skewness | 5.4185685 |
Sum | 665 |
Variance | 4445.7989 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
10 | 6 | |
7 | 4 | |
6 | 3 | |
12 | 2 | 6.7% |
14 | 2 | 6.7% |
15 | 2 | 6.7% |
2 | 2 | 6.7% |
8 | 1 | 3.3% |
3 | 1 | 3.3% |
5 | 1 | 3.3% |
Other values (6) | 6 |
Value | Count | Frequency (%) |
2 | 2 | 6.7% |
3 | 1 | 3.3% |
5 | 1 | 3.3% |
6 | 3 | |
7 | 4 | |
8 | 1 | 3.3% |
9 | 1 | 3.3% |
10 | 6 | |
11 | 1 | 3.3% |
12 | 2 | 6.7% |
Value | Count | Frequency (%) |
374 | 1 | 3.3% |
29 | 1 | 3.3% |
21 | 1 | 3.3% |
15 | 2 | 6.7% |
14 | 2 | 6.7% |
13 | 1 | 3.3% |
12 | 2 | 6.7% |
11 | 1 | 3.3% |
10 | 6 | |
9 | 1 | 3.3% |
적재일시(ldadng_dt)
Categorical
Distinct | 12 |
---|---|
Distinct (%) | 40.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
2017-11-21 16:45:55 | |
---|---|
2020-12-02 10:37:33 | 1 |
2019-12-04 16:02:31 | 1 |
2019-05-07 14:08:38 | 1 |
2019-09-05 13:52:51 | 1 |
Other values (7) |
Length
Max length | 19 |
---|---|
Median length | 19 |
Mean length | 19 |
Min length | 19 |
Unique
Unique | 11 ? |
---|---|
Unique (%) | 36.7% |
Sample
1st row | 2020-12-02 10:37:33 |
---|---|
2nd row | 2019-12-04 16:02:31 |
3rd row | 2017-11-21 16:45:55 |
4th row | 2017-11-21 16:45:55 |
5th row | 2019-05-07 14:08:38 |
Common Values
Value | Count | Frequency (%) |
2017-11-21 16:45:55 | 19 | |
2020-12-02 10:37:33 | 1 | 3.3% |
2019-12-04 16:02:31 | 1 | 3.3% |
2019-05-07 14:08:38 | 1 | 3.3% |
2019-09-05 13:52:51 | 1 | 3.3% |
2020-12-02 10:40:44 | 1 | 3.3% |
2018-07-25 13:28:32 | 1 | 3.3% |
2019-03-12 20:28:15 | 1 | 3.3% |
2020-12-02 10:41:15 | 1 | 3.3% |
2020-12-02 10:39:08 | 1 | 3.3% |
Other values (2) | 2 | 6.7% |
Length
Value | Count | Frequency (%) |
2017-11-21 | 19 | |
16:45:55 | 19 | |
2020-12-02 | 5 | 8.3% |
2018-07-25 | 1 | 1.7% |
2021-06-21 | 1 | 1.7% |
10:40:10 | 1 | 1.7% |
10:39:08 | 1 | 1.7% |
10:41:15 | 1 | 1.7% |
20:28:15 | 1 | 1.7% |
2019-03-12 | 1 | 1.7% |
Other values (10) | 10 |
조회기간(inqire_ym) | 시군구(signgu_nm) | 구청명(emd_nm) | 건수(managt_cnt) | 적재일시(ldadng_dt) | |
---|---|---|---|---|---|
조회기간(inqire_ym) | 1.000 | 0.462 | 0.792 | 0.000 | 0.729 |
시군구(signgu_nm) | 0.462 | 1.000 | 0.000 | 1.000 | 0.818 |
구청명(emd_nm) | 0.792 | 0.000 | 1.000 | 0.000 | 0.000 |
건수(managt_cnt) | 0.000 | 1.000 | 0.000 | 1.000 | 0.000 |
적재일시(ldadng_dt) | 0.729 | 0.818 | 0.000 | 0.000 | 1.000 |
조회기간(inqire_ym) | 건수(managt_cnt) | 적재일시(ldadng_dt) | |
---|---|---|---|
조회기간(inqire_ym) | 1.000 | -0.030 | 0.331 |
건수(managt_cnt) | -0.030 | 1.000 | 0.000 |
적재일시(ldadng_dt) | 0.331 | 0.000 | 1.000 |
조회기간(inqire_ym) | 시도명(ctprvn_nm) | 시군구(signgu_nm) | 구청명(emd_nm) | 건수(managt_cnt) | 적재일시(ldadng_dt) | |
---|---|---|---|---|---|---|
0 | 201804 | 서울특별시 | 서울특별시 중구 | 서울특별시 중구청 | 6 | 2020-12-02 10:37:33 |
1 | 201811 | 서울특별시 | 서울특별시 서대문구 | 서울특별시 강서구청 | 7 | 2019-12-04 16:02:31 |
2 | 201906 | 서울특별시 | 서울특별시 동작구 | 서울특별시 동작구청 | 10 | 2017-11-21 16:45:55 |
3 | 201609 | 서울특별시 | 서울특별시 강남구 | 서울특별시 성동구청 | 374 | 2017-11-21 16:45:55 |
4 | 201810 | 서울특별시 | 서울특별시 관악구 | 서울특별시 서대문구청 | 7 | 2019-05-07 14:08:38 |
5 | 201504 | 서울특별시 | 서울특별시 은평구 | 서울특별시 강북구청 | 12 | 2017-11-21 16:45:55 |
6 | 201712 | 서울특별시 | 서울특별시 은평구 | 서울특별시 동작구청 | 14 | 2017-11-21 16:45:55 |
7 | 201603 | 서울특별시 | 서울특별시 관악구 | 서울특별시 금천구청 | 7 | 2017-11-21 16:45:55 |
8 | 202011 | 서울특별시 | 서울특별시 마포구 | 서울특별시 구로구청 | 10 | 2019-09-05 13:52:51 |
9 | 202011 | 서울특별시 | 서울특별시 송파구 | 서울특별시 은평구청 | 15 | 2020-12-02 10:40:44 |
조회기간(inqire_ym) | 시도명(ctprvn_nm) | 시군구(signgu_nm) | 구청명(emd_nm) | 건수(managt_cnt) | 적재일시(ldadng_dt) | |
---|---|---|---|---|---|---|
20 | 202003 | 서울특별시 | 재외국민 가족관계등록사무소 | 서울특별시 관악구청 | 6 | 2020-12-02 10:41:15 |
21 | 201906 | 서울특별시 | 서울특별시 성동구 | 서울특별시 영등포구청 | 21 | 2017-11-21 16:45:55 |
22 | 201812 | 서울특별시 | 서울특별시 성북구 | 서울특별시 마포구청 | 8 | 2017-11-21 16:45:55 |
23 | 201512 | 서울특별시 | 서울특별시 서대문구 | 서울특별시 도봉구청 | 13 | 2020-12-02 10:39:08 |
24 | 201709 | 서울특별시 | 서울특별시 영등포구 | 서울특별시 구로구청 | 2 | 2020-12-02 10:40:10 |
25 | 202004 | 서울특별시 | 서울특별시 영등포구 | 서울특별시 관악구청 | 10 | 2017-11-21 16:45:55 |
26 | 201806 | 서울특별시 | 서울특별시 영등포구 | 서울특별시 성동구청 | 5 | 2017-11-21 16:45:55 |
27 | 201912 | 서울특별시 | 서울특별시 강서구 | 서울특별시 서대문구청 | 7 | 2017-11-21 16:45:55 |
28 | 202104 | 서울특별시 | 서울특별시 은평구 | 서울특별시 용산구청 | 10 | 2021-06-21 13:18:17 |
29 | 201910 | 서울특별시 | 서울특별시 성북구 | 서울특별시 강동구청 | 3 | 2017-11-21 16:45:55 |