Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 10718 |
Missing cells (%) | 21.4% |
Duplicate rows | 1071 |
Duplicate rows (%) | 10.7% |
Total size in memory | 488.3 KiB |
Average record size in memory | 50.0 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 1 |
Text | 2 |
Dataset
Description | 공장설립온라인지원시스템(팩토리온) 내 공장별(공장관리번호로 구분) 도로명주소변경신청내역을 보여줍니다. |
---|---|
Author | 한국산업단지공단 |
URL | https://www.data.go.kr/data/15127209/fileData.do |
Dataset has 1071 (10.7%) duplicate rows | Duplicates |
공장관리번호 is highly overall correlated with 시도명 | High correlation |
시도명 is highly overall correlated with 공장관리번호 | High correlation |
행정동명 has 724 (7.2%) missing values | Missing |
변경주소 has 9994 (99.9%) missing values | Missing |
Reproduction
Analysis started | 2024-03-23 05:48:29.339629 |
---|---|
Analysis finished | 2024-03-23 05:48:31.257947 |
Duration | 1.92 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
공장관리번호
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 652 |
---|---|
Distinct (%) | 6.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.6401404 × 1014 |
Minimum | 503 |
---|---|
Maximum | 9.52051 × 1014 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 503 |
---|---|
5-th percentile | 1.15452 × 1014 |
Q1 | 2.82602 × 1014 |
median | 4.13902 × 1014 |
Q3 | 4.37452 × 1014 |
95-th percentile | 4.82502 × 1014 |
Maximum | 9.52051 × 1014 |
Range | 9.52051 × 1014 |
Interquartile range (IQR) | 1.5485 × 1014 |
Descriptive statistics
Standard deviation | 1.1692644 × 1014 |
---|---|
Coefficient of variation (CV) | 0.32121408 |
Kurtosis | 0.93276174 |
Mean | 3.6401404 × 1014 |
Median Absolute Deviation (MAD) | 4.35505 × 1013 |
Skewness | -1.1403366 |
Sum | 3.6401404 × 1018 |
Variance | 1.3671791 × 1028 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
115452000000000 | 504 | 5.0% |
415902000000000 | 493 | 4.9% |
413902000000000 | 467 | 4.7% |
412732000000000 | 413 | 4.1% |
282002000000000 | 338 | 3.4% |
282602000000000 | 254 | 2.5% |
415702000000000 | 242 | 2.4% |
414802000000000 | 222 | 2.2% |
482502000000000 | 166 | 1.7% |
412202000000000 | 164 | 1.6% |
Other values (642) | 6737 |
Value | Count | Frequency (%) |
503 | 1 | |
869 | 1 | |
2016 | 1 | |
3832 | 1 | |
3988 | 1 | |
4022 | 1 | |
5695 | 1 | |
5946 | 1 | |
2003059510 | 1 | |
2009000012 | 1 |
Value | Count | Frequency (%) |
952051000000000 | 1 | |
920561000000000 | 1 | |
917481000000000 | 1 | |
913411000000000 | 1 | |
911011000000000 | 1 | |
671101000000000 | 1 | |
660208000000000 | 1 | |
651030000000000 | 1 | |
630815000000000 | 1 | |
630504000000000 | 1 |
최초등록일시
Real number (ℝ)
Distinct | 21 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2.0229937 × 1013 |
Minimum | 2.02207 × 1013 |
---|---|
Maximum | 2.02403 × 1013 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2.02207 × 1013 |
---|---|
5-th percentile | 2.02209 × 1013 |
Q1 | 2.02301 × 1013 |
median | 2.02306 × 1013 |
Q3 | 2.02311 × 1013 |
95-th percentile | 2.02402 × 1013 |
Maximum | 2.02403 × 1013 |
Range | 1.96 × 1010 |
Interquartile range (IQR) | 1 × 109 |
Descriptive statistics
Standard deviation | 6.0527312 × 109 |
---|---|
Coefficient of variation (CV) | 0.00029919674 |
Kurtosis | -0.51878915 |
Mean | 2.0229937 × 1013 |
Median Absolute Deviation (MAD) | 5 × 108 |
Skewness | 0.039323107 |
Sum | 2.0229937 × 1017 |
Variance | 3.6635556 × 1019 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20240100000000 | 678 | 6.8% |
20240200000000 | 628 | 6.3% |
20231100000000 | 608 | 6.1% |
20221200000000 | 581 | 5.8% |
20231200000000 | 538 | 5.4% |
20230100000000 | 533 | 5.3% |
20230300000000 | 528 | 5.3% |
20230800000000 | 504 | 5.0% |
20230400000000 | 490 | 4.9% |
20221100000000 | 485 | 4.9% |
Other values (11) | 4427 |
Value | Count | Frequency (%) |
20220700000000 | 53 | 0.5% |
20220800000000 | 435 | |
20220900000000 | 399 | |
20221000000000 | 421 | |
20221100000000 | 485 | |
20221200000000 | 581 | |
20230100000000 | 533 | |
20230200000000 | 470 | |
20230300000000 | 528 | |
20230400000000 | 490 |
Value | Count | Frequency (%) |
20240300000000 | 345 | |
20240200000000 | 628 | |
20240100000000 | 678 | |
20231200000000 | 538 | |
20231100000000 | 608 | |
20231000000000 | 456 | |
20230900000000 | 416 | |
20230800000000 | 504 | |
20230700000000 | 485 | |
20230600000000 | 480 |
시도명
Categorical
HIGH CORRELATION
 
Distinct | 22 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
경기도 | |
---|---|
서울특별시 | |
인천광역시 | |
<NA> | |
경상남도 | |
Other values (17) |
Length
Max length | 7 |
---|---|
Median length | 6 |
Mean length | 4.1035 |
Min length | 3 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 경상북도 |
---|---|
2nd row | 충청남도 |
3rd row | 전라남도 |
4th row | 경기도 |
5th row | 경기도 |
Common Values
Value | Count | Frequency (%) |
경기도 | 3391 | |
서울특별시 | 1059 | 10.6% |
인천광역시 | 728 | 7.3% |
<NA> | 723 | 7.2% |
경상남도 | 585 | 5.9% |
경상북도 | 522 | 5.2% |
부산광역시 | 480 | 4.8% |
충청북도 | 376 | 3.8% |
대구광역시 | 362 | 3.6% |
충청남도 | 360 | 3.6% |
Other values (12) | 1414 |
Length
Value | Count | Frequency (%) |
경기도 | 3391 | |
서울특별시 | 1059 | 10.6% |
인천광역시 | 728 | 7.3% |
na | 723 | 7.2% |
경상남도 | 585 | 5.9% |
경상북도 | 522 | 5.2% |
부산광역시 | 480 | 4.8% |
충청북도 | 376 | 3.8% |
대구광역시 | 362 | 3.6% |
충청남도 | 360 | 3.6% |
Other values (12) | 1414 |
행정동명
Text
MISSING
 
Distinct | 1910 |
---|---|
Distinct (%) | 20.6% |
Missing | 724 |
Missing (%) | 7.2% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
초지동 | 256 | 2.8% |
정왕1동 | 166 | 1.8% |
가산동 | 161 | 1.7% |
논현고잔동 | 143 | 1.5% |
상대원1동 | 98 | 1.1% |
녹산동 | 91 | 1.0% |
평동 | 78 | 0.8% |
정왕2동 | 70 | 0.8% |
구로제3동 | 64 | 0.7% |
논현2동 | 55 | 0.6% |
Other values (1900) | 8094 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 6732 | 20.8% |
면 | 1688 | 5.2% |
읍 | 1229 | 3.8% |
1 | 1114 | 3.4% |
2 | 1007 | 3.1% |
산 | 754 | 2.3% |
제 | 596 | 1.8% |
정 | 571 | 1.8% |
남 | 455 | 1.4% |
3 | 451 | 1.4% |
Other values (305) | 17764 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 29402 | |
Decimal Number | 2847 | 8.8% |
Other Punctuation | 112 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 6732 | |
면 | 1688 | 5.7% |
읍 | 1229 | 4.2% |
산 | 754 | 2.6% |
제 | 596 | 2.0% |
정 | 571 | 1.9% |
남 | 455 | 1.5% |
초 | 396 | 1.3% |
가 | 396 | 1.3% |
성 | 393 | 1.3% |
Other values (295) | 16192 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1114 | |
2 | 1007 | |
3 | 451 | |
4 | 103 | 3.6% |
5 | 94 | 3.3% |
6 | 45 | 1.6% |
7 | 27 | 0.9% |
8 | 4 | 0.1% |
9 | 2 | 0.1% |
Other Punctuation
Value | Count | Frequency (%) |
. | 112 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 29402 | |
Common | 2959 | 9.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 6732 | |
면 | 1688 | 5.7% |
읍 | 1229 | 4.2% |
산 | 754 | 2.6% |
제 | 596 | 2.0% |
정 | 571 | 1.9% |
남 | 455 | 1.5% |
초 | 396 | 1.3% |
가 | 396 | 1.3% |
성 | 393 | 1.3% |
Other values (295) | 16192 |
Common
Value | Count | Frequency (%) |
1 | 1114 | |
2 | 1007 | |
3 | 451 | |
. | 112 | 3.8% |
4 | 103 | 3.5% |
5 | 94 | 3.2% |
6 | 45 | 1.5% |
7 | 27 | 0.9% |
8 | 4 | 0.1% |
9 | 2 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 29402 | |
ASCII | 2959 | 9.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 6732 | |
면 | 1688 | 5.7% |
읍 | 1229 | 4.2% |
산 | 754 | 2.6% |
제 | 596 | 2.0% |
정 | 571 | 1.9% |
남 | 455 | 1.5% |
초 | 396 | 1.3% |
가 | 396 | 1.3% |
성 | 393 | 1.3% |
Other values (295) | 16192 |
ASCII
Value | Count | Frequency (%) |
1 | 1114 | |
2 | 1007 | |
3 | 451 | |
. | 112 | 3.8% |
4 | 103 | 3.5% |
5 | 94 | 3.2% |
6 | 45 | 1.5% |
7 | 27 | 0.9% |
8 | 4 | 0.1% |
9 | 2 | 0.1% |
변경주소
Text
MISSING
 
Distinct | 6 |
---|---|
Distinct (%) | 100.0% |
Missing | 9994 |
Missing (%) | 99.9% |
Memory size | 156.2 KiB |
Length
Max length | 27 |
---|---|
Median length | 22.5 |
Mean length | 21.666667 |
Min length | 19 |
Characters and Unicode
Total characters | 130 |
---|---|
Distinct characters | 56 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 6 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 경기도 여주시 흥천면 흥천로 63-2 |
---|---|
2nd row | 충청북도 청원군 오창읍 2산단로 81 |
3rd row | 경상남도 김해시 생림면 인제로694번길 19-52 |
4th row | 경북 경산시 하양읍 지식산업로 36 |
5th row | 경상북도 영천시 화산면 납이길 69 |
Value | Count | Frequency (%) |
김해시 | 2 | 6.7% |
경기도 | 1 | 3.3% |
경북 | 1 | 3.3% |
테크노밸리로 | 1 | 3.3% |
진례면 | 1 | 3.3% |
경남 | 1 | 3.3% |
69 | 1 | 3.3% |
납이길 | 1 | 3.3% |
화산면 | 1 | 3.3% |
영천시 | 1 | 3.3% |
Other values (19) | 19 |
Most occurring characters
Value | Count | Frequency (%) |
25 | 19.2% | |
경 | 6 | 4.6% |
9 | 5 | 3.8% |
시 | 5 | 3.8% |
로 | 5 | 3.8% |
도 | 4 | 3.1% |
면 | 4 | 3.1% |
6 | 4 | 3.1% |
2 | 4 | 3.1% |
산 | 4 | 3.1% |
Other values (46) | 64 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 80 | |
Space Separator | 25 | 19.2% |
Decimal Number | 22 | 16.9% |
Dash Punctuation | 3 | 2.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
경 | 6 | 7.5% |
시 | 5 | 6.2% |
로 | 5 | 6.2% |
도 | 4 | 5.0% |
면 | 4 | 5.0% |
산 | 4 | 5.0% |
천 | 3 | 3.8% |
북 | 3 | 3.8% |
길 | 2 | 2.5% |
해 | 2 | 2.5% |
Other values (36) | 42 |
Decimal Number
Value | Count | Frequency (%) |
9 | 5 | |
6 | 4 | |
2 | 4 | |
3 | 3 | |
1 | 3 | |
5 | 1 | 4.5% |
4 | 1 | 4.5% |
8 | 1 | 4.5% |
Space Separator
Value | Count | Frequency (%) |
25 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 80 | |
Common | 50 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
경 | 6 | 7.5% |
시 | 5 | 6.2% |
로 | 5 | 6.2% |
도 | 4 | 5.0% |
면 | 4 | 5.0% |
산 | 4 | 5.0% |
천 | 3 | 3.8% |
북 | 3 | 3.8% |
길 | 2 | 2.5% |
해 | 2 | 2.5% |
Other values (36) | 42 |
Common
Value | Count | Frequency (%) |
25 | ||
9 | 5 | 10.0% |
6 | 4 | 8.0% |
2 | 4 | 8.0% |
3 | 3 | 6.0% |
- | 3 | 6.0% |
1 | 3 | 6.0% |
5 | 1 | 2.0% |
4 | 1 | 2.0% |
8 | 1 | 2.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 80 | |
ASCII | 50 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
25 | ||
9 | 5 | 10.0% |
6 | 4 | 8.0% |
2 | 4 | 8.0% |
3 | 3 | 6.0% |
- | 3 | 6.0% |
1 | 3 | 6.0% |
5 | 1 | 2.0% |
4 | 1 | 2.0% |
8 | 1 | 2.0% |
Hangul
Value | Count | Frequency (%) |
경 | 6 | 7.5% |
시 | 5 | 6.2% |
로 | 5 | 6.2% |
도 | 4 | 5.0% |
면 | 4 | 5.0% |
산 | 4 | 5.0% |
천 | 3 | 3.8% |
북 | 3 | 3.8% |
길 | 2 | 2.5% |
해 | 2 | 2.5% |
Other values (36) | 42 |
공장관리번호 | 최초등록일시 | 시도명 | 변경주소 | |
---|---|---|---|---|
공장관리번호 | 1.000 | 0.079 | 0.833 | 1.000 |
최초등록일시 | 0.079 | 1.000 | 0.080 | 1.000 |
시도명 | 0.833 | 0.080 | 1.000 | 1.000 |
변경주소 | 1.000 | 1.000 | 1.000 | 1.000 |
공장관리번호 | 최초등록일시 | 시도명 | |
---|---|---|---|
공장관리번호 | 1.000 | 0.031 | 0.511 |
최초등록일시 | 0.031 | 1.000 | 0.043 |
시도명 | 0.511 | 0.043 | 1.000 |
공장관리번호 | 최초등록일시 | 시도명 | 행정동명 | 변경주소 | |
---|---|---|---|---|---|
87777 | 2022929119 | 20221000000000 | 경상북도 | 쌍림면 | <NA> |
53470 | 442702000000000 | 20230500000000 | 충청남도 | 정미면 | <NA> |
98478 | 292002000000000 | 20220800000000 | 전라남도 | 금천면 | <NA> |
46991 | 412202000000000 | 20230600000000 | 경기도 | 송탄동 | <NA> |
27688 | 411112000000000 | 20231100000000 | 경기도 | 파장동 | <NA> |
41173 | 272302000000000 | 20230800000000 | 대구광역시 | 노원동 | <NA> |
8345 | 271702000000000 | 20240200000000 | 대구광역시 | 용산1동 | <NA> |
24909 | 414802000000000 | 20231100000000 | 경기도 | 조리읍 | <NA> |
15700 | 415702000000000 | 20240100000000 | 경기도 | 고촌읍 | <NA> |
95419 | 411312000000000 | 20220800000000 | 서울특별시 | 서교동 | <NA> |
공장관리번호 | 최초등록일시 | 시도명 | 행정동명 | 변경주소 | |
---|---|---|---|---|---|
32236 | 2022943700 | 20231000000000 | 경기도 | 향남읍 | <NA> |
1036 | 115302000000000 | 20240300000000 | 서울특별시 | 세곡동 | <NA> |
33463 | 441312000000000 | 20230900000000 | <NA> | <NA> | <NA> |
29581 | 414802000000000 | 20231000000000 | 경기도 | 법원읍 | <NA> |
84374 | 115452000000000 | 20221100000000 | 경기도 | 별내동 | <NA> |
23453 | 417302000000000 | 20231100000000 | 경기도 | 가남읍 | <NA> |
44033 | 412852000000000 | 20230700000000 | 경기도 | 백석1동 | <NA> |
32831 | 411502000000000 | 20230900000000 | 경기도 | 송산1동 | <NA> |
36340 | 414302000000000 | 20230900000000 | 경기도 | 부곡동 | <NA> |
31624 | 414612000000000 | 20231000000000 | 경기도 | 모현읍 | <NA> |
Most frequently occurring
공장관리번호 | 최초등록일시 | 시도명 | 행정동명 | 변경주소 | # duplicates | |
---|---|---|---|---|---|---|
37 | 115452000000000 | 20221200000000 | 서울특별시 | 서초2동 | <NA> | 44 |
361 | 411132000000000 | 20231100000000 | 경기도 | 평동 | <NA> | 30 |
33 | 115452000000000 | 20221100000000 | 경기도 | 별내동 | <NA> | 24 |
461 | 412732000000000 | 20221100000000 | 경기도 | 초지동 | <NA> | 19 |
492 | 412732000000000 | 20240100000000 | 경기도 | 초지동 | <NA> | 19 |
36 | 115452000000000 | 20221200000000 | 서울특별시 | 가산동 | <NA> | 18 |
518 | 413902000000000 | 20220800000000 | 경기도 | 정왕1동 | <NA> | 17 |
454 | 412732000000000 | 20220800000000 | 경기도 | 초지동 | <NA> | 16 |
532 | 413902000000000 | 20221100000000 | 경기도 | 정왕1동 | <NA> | 13 |
538 | 413902000000000 | 20221200000000 | 경기도 | 정왕1동 | <NA> | 13 |