Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 10000 |
Missing cells | 9998 |
Missing cells (%) | 16.7% |
Duplicate rows | 350 |
Duplicate rows (%) | 3.5% |
Total size in memory | 566.4 KiB |
Average record size in memory | 58.0 B |
Variable types
Categorical | 2 |
---|---|
Text | 2 |
Numeric | 2 |
Dataset
Description | 용달화물(운송사업)업체 현황 |
---|---|
Author | 행정안전부 |
URL | https://data.gg.go.kr/portal/data/service/selectServicePage.do?&infId=8Z5W0HZY4678V34SM3731032087&infSeq=1 |
영업상태명 has constant value "" | Constant |
Dataset has 350 (3.5%) duplicate rows | Duplicates |
폐업일자 is highly overall correlated with 시군명 | High correlation |
시군명 is highly overall correlated with 폐업일자 | High correlation |
폐업일자 has 9992 (99.9%) missing values | Missing |
Reproduction
Analysis started | 2023-12-10 21:19:13.594599 |
---|---|
Analysis finished | 2023-12-10 21:19:14.629160 |
Duration | 1.03 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시군명
Categorical
HIGH CORRELATION
 
Distinct | 32 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
성남시 | |
---|---|
남양주시 | |
부천시 | |
수원시 | |
고양시 | |
Other values (27) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.1188 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 김포시 |
---|---|
2nd row | 광주시 |
3rd row | 남양주시 |
4th row | 고양시 |
5th row | 고양시 |
Common Values
Value | Count | Frequency (%) |
성남시 | 792 | 7.9% |
남양주시 | 782 | 7.8% |
부천시 | 774 | 7.7% |
수원시 | 743 | 7.4% |
고양시 | 726 | 7.3% |
시흥시 | 562 | 5.6% |
안산시 | 547 | 5.5% |
용인시 | 529 | 5.3% |
화성시 | 492 | 4.9% |
안양시 | 454 | 4.5% |
Other values (22) | 3599 |
Length
Value | Count | Frequency (%) |
성남시 | 792 | 7.9% |
남양주시 | 782 | 7.8% |
부천시 | 774 | 7.7% |
수원시 | 743 | 7.4% |
고양시 | 726 | 7.3% |
시흥시 | 562 | 5.6% |
안산시 | 547 | 5.5% |
용인시 | 529 | 5.3% |
화성시 | 492 | 4.9% |
안양시 | 454 | 4.5% |
Other values (22) | 3599 |
사업장명
Text
Distinct | 83 |
---|---|
Distinct (%) | 0.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
9919 | ||
주식회사 | 2 | < 0.1% |
주)진산물류 | 1 | < 0.1% |
주)영훈운수 | 1 | < 0.1% |
주)케이알 | 1 | < 0.1% |
주)디앤아이 | 1 | < 0.1% |
이주운수(주 | 1 | < 0.1% |
주)삼마통운 | 1 | < 0.1% |
현대종합물류㈜ | 1 | < 0.1% |
주)이스테이지 | 1 | < 0.1% |
Other values (75) | 75 | 0.7% |
Most occurring characters
Value | Count | Frequency (%) |
* | 29754 | |
( | 79 | 0.3% |
) | 79 | 0.3% |
주 | 77 | 0.3% |
스 | 29 | 0.1% |
물 | 28 | 0.1% |
류 | 23 | 0.1% |
22 | 0.1% | |
이 | 17 | 0.1% |
운 | 17 | 0.1% |
Other values (124) | 333 | 1.1% |
Most occurring categories
Value | Count | Frequency (%) |
Other Punctuation | 29755 | |
Other Letter | 496 | 1.6% |
Open Punctuation | 79 | 0.3% |
Close Punctuation | 79 | 0.3% |
Decimal Number | 24 | 0.1% |
Space Separator | 22 | 0.1% |
Other Symbol | 2 | < 0.1% |
Dash Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 77 | 15.5% |
스 | 29 | 5.8% |
물 | 28 | 5.6% |
류 | 23 | 4.6% |
이 | 17 | 3.4% |
운 | 17 | 3.4% |
지 | 16 | 3.2% |
로 | 15 | 3.0% |
통 | 11 | 2.2% |
대 | 10 | 2.0% |
Other values (108) | 253 |
Decimal Number
Value | Count | Frequency (%) |
4 | 5 | |
9 | 4 | |
7 | 3 | |
5 | 3 | |
1 | 2 | 8.3% |
8 | 2 | 8.3% |
2 | 2 | 8.3% |
6 | 2 | 8.3% |
0 | 1 | 4.2% |
Other Punctuation
Value | Count | Frequency (%) |
* | 29754 | |
: | 1 | < 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 79 |
Close Punctuation
Value | Count | Frequency (%) |
) | 79 |
Space Separator
Value | Count | Frequency (%) |
22 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 2 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 29960 | |
Hangul | 498 | 1.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 77 | 15.5% |
스 | 29 | 5.8% |
물 | 28 | 5.6% |
류 | 23 | 4.6% |
이 | 17 | 3.4% |
운 | 17 | 3.4% |
지 | 16 | 3.2% |
로 | 15 | 3.0% |
통 | 11 | 2.2% |
대 | 10 | 2.0% |
Other values (109) | 255 |
Common
Value | Count | Frequency (%) |
* | 29754 | |
( | 79 | 0.3% |
) | 79 | 0.3% |
22 | 0.1% | |
4 | 5 | < 0.1% |
9 | 4 | < 0.1% |
7 | 3 | < 0.1% |
5 | 3 | < 0.1% |
1 | 2 | < 0.1% |
8 | 2 | < 0.1% |
Other values (5) | 7 | < 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 29960 | |
Hangul | 496 | 1.6% |
None | 2 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
* | 29754 | |
( | 79 | 0.3% |
) | 79 | 0.3% |
22 | 0.1% | |
4 | 5 | < 0.1% |
9 | 4 | < 0.1% |
7 | 3 | < 0.1% |
5 | 3 | < 0.1% |
1 | 2 | < 0.1% |
8 | 2 | < 0.1% |
Other values (5) | 7 | < 0.1% |
Hangul
Value | Count | Frequency (%) |
주 | 77 | 15.5% |
스 | 29 | 5.8% |
물 | 28 | 5.6% |
류 | 23 | 4.6% |
이 | 17 | 3.4% |
운 | 17 | 3.4% |
지 | 16 | 3.2% |
로 | 15 | 3.0% |
통 | 11 | 2.2% |
대 | 10 | 2.0% |
Other values (108) | 253 |
None
Value | Count | Frequency (%) |
㈜ | 2 |
인허가일자
Real number (ℝ)
Distinct | 3997 |
---|---|
Distinct (%) | 40.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20032030 |
Minimum | 19000102 |
---|---|
Maximum | 20170507 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 19000102 |
---|---|
5-th percentile | 19910531 |
Q1 | 20001019 |
median | 20030217 |
Q3 | 20070221 |
95-th percentile | 20160627 |
Maximum | 20170507 |
Range | 1170405 |
Interquartile range (IQR) | 69202.25 |
Descriptive statistics
Standard deviation | 86768.884 |
---|---|
Coefficient of variation (CV) | 0.0043315073 |
Kurtosis | 54.508529 |
Mean | 20032030 |
Median Absolute Deviation (MAD) | 30005 |
Skewness | -4.8085504 |
Sum | 2.003203 × 1011 |
Variance | 7.5288392 × 109 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20040421 | 25 | 0.2% |
20170501 | 24 | 0.2% |
20161125 | 21 | 0.2% |
20170502 | 19 | 0.2% |
19801115 | 15 | 0.1% |
20160627 | 15 | 0.1% |
20021107 | 15 | 0.1% |
20170504 | 15 | 0.1% |
19990705 | 14 | 0.1% |
19801113 | 13 | 0.1% |
Other values (3987) | 9824 |
Value | Count | Frequency (%) |
19000102 | 1 | |
19000129 | 1 | |
19000221 | 1 | |
19000305 | 1 | |
19000320 | 1 | |
19000329 | 2 | |
19000428 | 1 | |
19000520 | 1 | |
19000710 | 1 | |
19000714 | 1 |
Value | Count | Frequency (%) |
20170507 | 2 | < 0.1% |
20170504 | 15 | |
20170502 | 19 | |
20170501 | 24 | |
20170428 | 10 | |
20170427 | 4 | < 0.1% |
20170426 | 10 | |
20170425 | 8 | 0.1% |
20170424 | 1 | < 0.1% |
20170421 | 7 | 0.1% |
영업상태명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
운영중 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 운영중 |
---|---|
2nd row | 운영중 |
3rd row | 운영중 |
4th row | 운영중 |
5th row | 운영중 |
Common Values
Value | Count | Frequency (%) |
운영중 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
운영중 | 10000 |
폐업일자
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 8 |
---|---|
Distinct (%) | 100.0% |
Missing | 9992 |
Missing (%) | 99.9% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20129494 |
Minimum | 20100813 |
---|---|
Maximum | 20160504 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 20100813 |
---|---|
5-th percentile | 20104246 |
Q1 | 20110772 |
median | 20125678 |
Q3 | 20150818 |
95-th percentile | 20157221 |
Maximum | 20160504 |
Range | 59691 |
Interquartile range (IQR) | 40045.75 |
Descriptive statistics
Standard deviation | 23499.106 |
---|---|
Coefficient of variation (CV) | 0.0011673967 |
Kurtosis | -2.1998546 |
Mean | 20129494 |
Median Absolute Deviation (MAD) | 19960.5 |
Skewness | 0.11220968 |
Sum | 1.6103596 × 108 |
Variance | 5.5220798 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20110822 | 1 | < 0.1% |
20110621 | 1 | < 0.1% |
20100813 | 1 | < 0.1% |
20160504 | 1 | < 0.1% |
20111031 | 1 | < 0.1% |
20151125 | 1 | < 0.1% |
20150715 | 1 | < 0.1% |
20140324 | 1 | < 0.1% |
(Missing) | 9992 |
Value | Count | Frequency (%) |
20100813 | 1 | |
20110621 | 1 | |
20110822 | 1 | |
20111031 | 1 | |
20140324 | 1 | |
20150715 | 1 | |
20151125 | 1 | |
20160504 | 1 |
Value | Count | Frequency (%) |
20160504 | 1 | |
20151125 | 1 | |
20150715 | 1 | |
20140324 | 1 | |
20111031 | 1 | |
20110822 | 1 | |
20110621 | 1 | |
20100813 | 1 |
소재지지번주소
Text
Distinct | 426 |
---|---|
Distinct (%) | 4.3% |
Missing | 6 |
Missing (%) | 0.1% |
Memory size | 156.2 KiB |
Length
Max length | 14 |
---|---|
Median length | 11 |
Mean length | 11.138183 |
Min length | 10 |
Characters and Unicode
Total characters | 111315 |
---|---|
Distinct characters | 208 |
Distinct categories | 2 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 71 ? |
---|---|
Unique (%) | 0.7% |
Sample
1st row | 경기도 김포시 대곶면 |
---|---|
2nd row | 경기도 광주시 오포읍 |
3rd row | 경기도 남양주시 오남읍 |
4th row | 경기도 고양시 덕양구 |
5th row | 경기도 고양시 일산동구 |
Value | Count | Frequency (%) |
경기도 | 9991 | |
성남시 | 792 | 2.6% |
남양주시 | 782 | 2.6% |
부천시 | 773 | 2.6% |
수원시 | 743 | 2.5% |
고양시 | 726 | 2.4% |
시흥시 | 558 | 1.9% |
안산시 | 547 | 1.8% |
용인시 | 529 | 1.8% |
화성시 | 492 | 1.6% |
Other values (442) | 14049 |
Most occurring characters
Value | Count | Frequency (%) |
19988 | ||
시 | 10471 | 9.4% |
도 | 10292 | 9.2% |
기 | 10276 | 9.2% |
경 | 10004 | 9.0% |
동 | 4957 | 4.5% |
구 | 3993 | 3.6% |
양 | 2703 | 2.4% |
안 | 2090 | 1.9% |
남 | 1963 | 1.8% |
Other values (198) | 34578 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 91327 | |
Space Separator | 19988 | 18.0% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 10471 | 11.5% |
도 | 10292 | 11.3% |
기 | 10276 | 11.3% |
경 | 10004 | 11.0% |
동 | 4957 | 5.4% |
구 | 3993 | 4.4% |
양 | 2703 | 3.0% |
안 | 2090 | 2.3% |
남 | 1963 | 2.1% |
주 | 1677 | 1.8% |
Other values (197) | 32901 |
Space Separator
Value | Count | Frequency (%) |
19988 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 91327 | |
Common | 19988 | 18.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 10471 | 11.5% |
도 | 10292 | 11.3% |
기 | 10276 | 11.3% |
경 | 10004 | 11.0% |
동 | 4957 | 5.4% |
구 | 3993 | 4.4% |
양 | 2703 | 3.0% |
안 | 2090 | 2.3% |
남 | 1963 | 2.1% |
주 | 1677 | 1.8% |
Other values (197) | 32901 |
Common
Value | Count | Frequency (%) |
19988 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 91327 | |
ASCII | 19988 | 18.0% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
19988 |
Hangul
Value | Count | Frequency (%) |
시 | 10471 | 11.5% |
도 | 10292 | 11.3% |
기 | 10276 | 11.3% |
경 | 10004 | 11.0% |
동 | 4957 | 5.4% |
구 | 3993 | 4.4% |
양 | 2703 | 3.0% |
안 | 2090 | 2.3% |
남 | 1963 | 2.1% |
주 | 1677 | 1.8% |
Other values (197) | 32901 |
시군명 | 사업장명 | 인허가일자 | 폐업일자 | |
---|---|---|---|---|
시군명 | 1.000 | 0.266 | 0.245 | 1.000 |
사업장명 | 0.266 | 1.000 | 0.000 | NaN |
인허가일자 | 0.245 | 0.000 | 1.000 | 0.711 |
폐업일자 | 1.000 | NaN | 0.711 | 1.000 |
인허가일자 | 폐업일자 | 시군명 | |
---|---|---|---|
인허가일자 | 1.000 | -0.238 | 0.117 |
폐업일자 | -0.238 | 1.000 | 0.816 |
시군명 | 0.117 | 0.816 | 1.000 |
시군명 | 사업장명 | 인허가일자 | 영업상태명 | 폐업일자 | 소재지지번주소 | |
---|---|---|---|---|---|---|
6828 | 김포시 | *** | 20050908 | 운영중 | <NA> | 경기도 김포시 대곶면 |
4376 | 광주시 | *** | 20020521 | 운영중 | <NA> | 경기도 광주시 오포읍 |
9659 | 남양주시 | *** | 20010716 | 운영중 | <NA> | 경기도 남양주시 오남읍 |
1909 | 고양시 | *** | 20030925 | 운영중 | <NA> | 경기도 고양시 덕양구 |
1161 | 고양시 | *** | 20020318 | 운영중 | <NA> | 경기도 고양시 일산동구 |
7236 | 남양주시 | *** | 19990723 | 운영중 | <NA> | 경기도 남양주시 진접읍 |
14326 | 성남시 | *** | 20020618 | 운영중 | <NA> | 경기도 성남시 수정구 |
15756 | 수원시 | *** | 20050404 | 운영중 | <NA> | 경기도 수원시 권선구 |
21386 | 안성시 | *** | 20020822 | 운영중 | <NA> | 경기도 안성시 금석동 |
13515 | 성남시 | *** | 19980213 | 운영중 | <NA> | 경기도 성남시 중원구 |
시군명 | 사업장명 | 인허가일자 | 영업상태명 | 폐업일자 | 소재지지번주소 | |
---|---|---|---|---|---|---|
22058 | 안양시 | *** | 20071120 | 운영중 | <NA> | 경기도 안양시 만안구 |
22993 | 안양시 | *** | 20070726 | 운영중 | <NA> | 경기도 안양시 동안구 |
21600 | 안성시 | *** | 20030730 | 운영중 | <NA> | 경기도 안성시 미양면 |
17489 | 수원시 | *** | 20050601 | 운영중 | <NA> | 경기도 수원시 팔달구 |
14019 | 성남시 | *** | 20020221 | 운영중 | <NA> | 경기도 성남시 수정구 |
28906 | 파주시 | *** | 20010828 | 운영중 | <NA> | 경기도 파주시 법원읍 |
5201 | 구리시 | *** | 20030122 | 운영중 | <NA> | 경기도 구리시 교문동 |
9506 | 남양주시 | *** | 20070704 | 운영중 | <NA> | 경기도 남양주시 호평동 |
21612 | 안성시 | *** | 20030421 | 운영중 | <NA> | 경기도 안성시 공도읍 |
17827 | 시흥시 | *** | 20040821 | 운영중 | <NA> | 경기도 시흥시 논곡동 |
Most frequently occurring
시군명 | 사업장명 | 인허가일자 | 영업상태명 | 폐업일자 | 소재지지번주소 | # duplicates | |
---|---|---|---|---|---|---|---|
285 | 안양시 | *** | 20170504 | 운영중 | <NA> | 경기도 안양시 만안구 | 8 |
315 | 용인시 | *** | 20150521 | 운영중 | <NA> | 경기도 용인시 처인구 | 6 |
325 | 용인시 | *** | 20170501 | 운영중 | <NA> | 경기도 용인시 기흥구 | 6 |
34 | 고양시 | *** | 20150423 | 운영중 | <NA> | 경기도 고양시 덕양구 | 5 |
46 | 고양시 | *** | 20161205 | 운영중 | <NA> | 경기도 고양시 일산동구 | 5 |
48 | 고양시 | *** | 20161206 | 운영중 | <NA> | 경기도 고양시 덕양구 | 5 |
210 | 수원시 | *** | 20130624 | 운영중 | <NA> | 경기도 수원시 권선구 | 5 |
284 | 안양시 | *** | 20170504 | 운영중 | <NA> | 경기도 안양시 동안구 | 5 |
115 | 부천시 | *** | 20141218 | 운영중 | <NA> | 경기도 부천시 고강동 | 4 |
123 | 성남시 | *** | 19880128 | 운영중 | <NA> | 경기도 성남시 중원구 | 4 |