Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 85 |
Missing cells | 136 |
Missing cells (%) | 26.7% |
Duplicate rows | 1 |
Duplicate rows (%) | 1.2% |
Total size in memory | 4.3 KiB |
Average record size in memory | 51.6 B |
Variable types
Numeric | 2 |
---|---|
Text | 2 |
Categorical | 2 |
Dataset
Description | 김천시 내에 소재하고 있는 화물자동차운송업체와 관련한 데이터로 업체명, 면허종류, 차량대수, 주소, 현재운영여부정보를 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15114917/fileData.do |
Dataset has 1 (1.2%) duplicate rows | Duplicates |
현재운영여부 is highly overall correlated with 연번 and 2 other fields | High correlation |
면허종류 is highly overall correlated with 차량대수 and 1 other fields | High correlation |
연번 is highly overall correlated with 현재운영여부 | High correlation |
차량대수 is highly overall correlated with 면허종류 and 1 other fields | High correlation |
연번 has 34 (40.0%) missing values | Missing |
업체명 has 34 (40.0%) missing values | Missing |
차량대수 has 34 (40.0%) missing values | Missing |
주소 has 34 (40.0%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 17:39:36.879567 |
---|---|
Analysis finished | 2023-12-12 17:39:37.867768 |
Duration | 0.99 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 51 |
---|---|
Distinct (%) | 100.0% |
Missing | 34 |
Missing (%) | 40.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 26 |
Minimum | 1 |
---|---|
Maximum | 51 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 897.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 3.5 |
Q1 | 13.5 |
median | 26 |
Q3 | 38.5 |
95-th percentile | 48.5 |
Maximum | 51 |
Range | 50 |
Interquartile range (IQR) | 25 |
Descriptive statistics
Standard deviation | 14.866069 |
---|---|
Coefficient of variation (CV) | 0.57177187 |
Kurtosis | -1.2 |
Mean | 26 |
Median Absolute Deviation (MAD) | 13 |
Skewness | 0 |
Sum | 1326 |
Variance | 221 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
2 | 1 | 1.2% |
29 | 1 | 1.2% |
30 | 1 | 1.2% |
31 | 1 | 1.2% |
32 | 1 | 1.2% |
33 | 1 | 1.2% |
34 | 1 | 1.2% |
35 | 1 | 1.2% |
36 | 1 | 1.2% |
37 | 1 | 1.2% |
Other values (41) | 41 | |
(Missing) | 34 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
51 | 1 | |
50 | 1 | |
49 | 1 | |
48 | 1 | |
47 | 1 | |
46 | 1 | |
45 | 1 | |
44 | 1 | |
43 | 1 | |
42 | 1 |
업체명
Text
MISSING
 
Distinct | 51 |
---|---|
Distinct (%) | 100.0% |
Missing | 34 |
Missing (%) | 40.0% |
Memory size | 812.0 B |
Value | Count | Frequency (%) |
주)그린물류 | 1 | 1.8% |
주)창신종합물류 | 1 | 1.8% |
김천합동운수㈜ | 1 | 1.8% |
김천혁신카고크레인 | 1 | 1.8% |
남김천렉카 | 1 | 1.8% |
늘 | 1 | 1.8% |
푸름 | 1 | 1.8% |
물류 | 1 | 1.8% |
다산물류㈜ | 1 | 1.8% |
대박운수(주 | 1 | 1.8% |
Other values (46) | 46 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 27 | 7.8% |
) | 26 | 7.6% |
( | 26 | 7.6% |
물 | 23 | 6.7% |
류 | 17 | 4.9% |
천 | 16 | 4.7% |
김 | 15 | 4.4% |
카 | 9 | 2.6% |
수 | 8 | 2.3% |
화 | 7 | 2.0% |
Other values (100) | 170 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 280 | |
Close Punctuation | 26 | 7.6% |
Open Punctuation | 26 | 7.6% |
Other Symbol | 5 | 1.5% |
Space Separator | 5 | 1.5% |
Decimal Number | 2 | 0.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 27 | 9.6% |
물 | 23 | 8.2% |
류 | 17 | 6.1% |
천 | 16 | 5.7% |
김 | 15 | 5.4% |
카 | 9 | 3.2% |
수 | 8 | 2.9% |
화 | 7 | 2.5% |
스 | 6 | 2.1% |
합 | 6 | 2.1% |
Other values (94) | 146 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1 | |
6 | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 26 |
Open Punctuation
Value | Count | Frequency (%) |
( | 26 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 5 |
Space Separator
Value | Count | Frequency (%) |
5 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 285 | |
Common | 59 | 17.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 27 | 9.5% |
물 | 23 | 8.1% |
류 | 17 | 6.0% |
천 | 16 | 5.6% |
김 | 15 | 5.3% |
카 | 9 | 3.2% |
수 | 8 | 2.8% |
화 | 7 | 2.5% |
스 | 6 | 2.1% |
합 | 6 | 2.1% |
Other values (95) | 151 |
Common
Value | Count | Frequency (%) |
) | 26 | |
( | 26 | |
5 | 8.5% | |
1 | 1 | 1.7% |
6 | 1 | 1.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 280 | |
ASCII | 59 | 17.2% |
None | 5 | 1.5% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 27 | 9.6% |
물 | 23 | 8.2% |
류 | 17 | 6.1% |
천 | 16 | 5.7% |
김 | 15 | 5.4% |
카 | 9 | 3.2% |
수 | 8 | 2.9% |
화 | 7 | 2.5% |
스 | 6 | 2.1% |
합 | 6 | 2.1% |
Other values (94) | 146 |
ASCII
Value | Count | Frequency (%) |
) | 26 | |
( | 26 | |
5 | 8.5% | |
1 | 1 | 1.7% |
6 | 1 | 1.7% |
None
Value | Count | Frequency (%) |
㈜ | 5 |
면허종류
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 3.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 812.0 B |
(구)일반화물 | |
---|---|
<NA> | |
일반화물 |
Length
Max length | 7 |
---|---|
Median length | 4 |
Mean length | 5.4117647 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | (구)일반화물 |
---|---|
2nd row | (구)일반화물 |
3rd row | 일반화물 |
4th row | (구)일반화물 |
5th row | (구)일반화물 |
Common Values
Value | Count | Frequency (%) |
(구)일반화물 | 40 | |
<NA> | 34 | |
일반화물 | 11 | 12.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
구)일반화물 | 40 | |
na | 34 | |
일반화물 | 11 | 12.9% |
차량대수
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 19 |
---|---|
Distinct (%) | 37.3% |
Missing | 34 |
Missing (%) | 40.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 11.72549 |
Minimum | 1 |
---|---|
Maximum | 98 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 897.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 3 |
Q3 | 18.5 |
95-th percentile | 50.5 |
Maximum | 98 |
Range | 97 |
Interquartile range (IQR) | 17.5 |
Descriptive statistics
Standard deviation | 20.037044 |
---|---|
Coefficient of variation (CV) | 1.7088449 |
Kurtosis | 9.4708859 |
Mean | 11.72549 |
Median Absolute Deviation (MAD) | 2 |
Skewness | 2.9818276 |
Sum | 598 |
Variance | 401.48314 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 14 | |
2 | 7 | 8.2% |
3 | 6 | 7.1% |
5 | 5 | 5.9% |
4 | 2 | 2.4% |
20 | 2 | 2.4% |
21 | 2 | 2.4% |
7 | 2 | 2.4% |
18 | 1 | 1.2% |
19 | 1 | 1.2% |
Other values (9) | 9 | 10.6% |
(Missing) | 34 |
Value | Count | Frequency (%) |
1 | 14 | |
2 | 7 | |
3 | 6 | |
4 | 2 | 2.4% |
5 | 5 | 5.9% |
7 | 2 | 2.4% |
9 | 1 | 1.2% |
18 | 1 | 1.2% |
19 | 1 | 1.2% |
20 | 2 | 2.4% |
Value | Count | Frequency (%) |
98 | 1 | |
84 | 1 | |
63 | 1 | |
38 | 1 | |
25 | 1 | |
24 | 1 | |
23 | 1 | |
22 | 1 | |
21 | 2 | |
20 | 2 |
주소
Text
MISSING
 
Distinct | 32 |
---|---|
Distinct (%) | 62.7% |
Missing | 34 |
Missing (%) | 40.0% |
Memory size | 812.0 B |
Length
Max length | 37 |
---|---|
Median length | 26 |
Mean length | 19 |
Min length | 8 |
Characters and Unicode
Total characters | 969 |
---|---|
Distinct characters | 98 |
Distinct categories | 7 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 27 ? |
---|---|
Unique (%) | 52.9% |
Sample
1st row | 경상북도 김천시 새까끔길 5 (다수동) |
---|---|
2nd row | 경상북도 김천시 공단2길 30-30, 조흥은행 (대광동) |
3rd row | 경상북도 김천시 중앙시장길 38, 1층 (모암동) |
4th row | 경상북도 김천시 중앙시장길 38, 1층 (모암동) |
5th row | 경상북도 김천시 농소면 벽소로 2119 |
Value | Count | Frequency (%) |
경상북도 | 51 | |
김천시 | 51 | |
아포읍 | 7 | 3.1% |
금계길 | 7 | 3.1% |
부곡동 | 6 | 2.7% |
대학로 | 4 | 1.8% |
어모면 | 4 | 1.8% |
35 | 4 | 1.8% |
영남대로 | 3 | 1.3% |
평화동 | 3 | 1.3% |
Other values (64) | 83 |
Most occurring characters
Value | Count | Frequency (%) |
172 | ||
경 | 53 | 5.5% |
시 | 53 | 5.5% |
천 | 52 | 5.4% |
북 | 51 | 5.3% |
도 | 51 | 5.3% |
김 | 51 | 5.3% |
상 | 51 | 5.3% |
1 | 29 | 3.0% |
) | 25 | 2.6% |
Other values (88) | 381 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 617 | |
Space Separator | 172 | 17.8% |
Decimal Number | 115 | 11.9% |
Close Punctuation | 25 | 2.6% |
Open Punctuation | 25 | 2.6% |
Other Punctuation | 9 | 0.9% |
Dash Punctuation | 6 | 0.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
경 | 53 | 8.6% |
시 | 53 | 8.6% |
천 | 52 | 8.4% |
북 | 51 | 8.3% |
도 | 51 | 8.3% |
김 | 51 | 8.3% |
상 | 51 | 8.3% |
동 | 25 | 4.1% |
길 | 19 | 3.1% |
로 | 18 | 2.9% |
Other values (73) | 193 |
Decimal Number
Value | Count | Frequency (%) |
1 | 29 | |
3 | 21 | |
2 | 19 | |
4 | 9 | 7.8% |
5 | 9 | 7.8% |
9 | 7 | 6.1% |
0 | 6 | 5.2% |
7 | 6 | 5.2% |
8 | 6 | 5.2% |
6 | 3 | 2.6% |
Space Separator
Value | Count | Frequency (%) |
172 |
Close Punctuation
Value | Count | Frequency (%) |
) | 25 |
Open Punctuation
Value | Count | Frequency (%) |
( | 25 |
Other Punctuation
Value | Count | Frequency (%) |
, | 9 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 6 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 617 | |
Common | 352 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
경 | 53 | 8.6% |
시 | 53 | 8.6% |
천 | 52 | 8.4% |
북 | 51 | 8.3% |
도 | 51 | 8.3% |
김 | 51 | 8.3% |
상 | 51 | 8.3% |
동 | 25 | 4.1% |
길 | 19 | 3.1% |
로 | 18 | 2.9% |
Other values (73) | 193 |
Common
Value | Count | Frequency (%) |
172 | ||
1 | 29 | 8.2% |
) | 25 | 7.1% |
( | 25 | 7.1% |
3 | 21 | 6.0% |
2 | 19 | 5.4% |
4 | 9 | 2.6% |
, | 9 | 2.6% |
5 | 9 | 2.6% |
9 | 7 | 2.0% |
Other values (5) | 27 | 7.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 617 | |
ASCII | 352 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
172 | ||
1 | 29 | 8.2% |
) | 25 | 7.1% |
( | 25 | 7.1% |
3 | 21 | 6.0% |
2 | 19 | 5.4% |
4 | 9 | 2.6% |
, | 9 | 2.6% |
5 | 9 | 2.6% |
9 | 7 | 2.0% |
Other values (5) | 27 | 7.7% |
Hangul
Value | Count | Frequency (%) |
경 | 53 | 8.6% |
시 | 53 | 8.6% |
천 | 52 | 8.4% |
북 | 51 | 8.3% |
도 | 51 | 8.3% |
김 | 51 | 8.3% |
상 | 51 | 8.3% |
동 | 25 | 4.1% |
길 | 19 | 3.1% |
로 | 18 | 2.9% |
Other values (73) | 193 |
현재운영여부
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 2.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 812.0 B |
영업중 | |
---|---|
<NA> |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.4 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 영업중 |
---|---|
2nd row | 영업중 |
3rd row | 영업중 |
4th row | 영업중 |
5th row | 영업중 |
Common Values
Value | Count | Frequency (%) |
영업중 | 51 | |
<NA> | 34 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
영업중 | 51 | |
na | 34 |
연번 | 업체명 | 면허종류 | 차량대수 | 주소 | |
---|---|---|---|---|---|
연번 | 1.000 | 1.000 | 0.000 | 0.071 | 0.709 |
업체명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
면허종류 | 0.000 | 1.000 | 1.000 | 0.862 | 0.712 |
차량대수 | 0.071 | 1.000 | 0.862 | 1.000 | 0.750 |
주소 | 0.709 | 1.000 | 0.712 | 0.750 | 1.000 |
현재운영여부 | 면허종류 | |
---|---|---|
현재운영여부 | 1.000 | 1.000 |
면허종류 | 1.000 | 1.000 |
연번 | 차량대수 | 면허종류 | 현재운영여부 | |
---|---|---|---|---|
연번 | 1.000 | 0.104 | 0.169 | 1.000 |
차량대수 | 0.104 | 1.000 | 0.883 | 1.000 |
면허종류 | 0.169 | 0.883 | 1.000 | 1.000 |
현재운영여부 | 1.000 | 1.000 | 1.000 | 1.000 |
연번 | 업체명 | 면허종류 | 차량대수 | 주소 | 현재운영여부 | |
---|---|---|---|---|---|---|
0 | 1 | (주)고속렉카 | (구)일반화물 | 3 | 경상북도 김천시 새까끔길 5 (다수동) | 영업중 |
1 | 2 | (주)그린물류 | (구)일반화물 | 3 | 경상북도 김천시 공단2길 30-30, 조흥은행 (대광동) | 영업중 |
2 | 3 | (주)글로벌스피드 | 일반화물 | 38 | 경상북도 김천시 중앙시장길 38, 1층 (모암동) | 영업중 |
3 | 4 | (주)글로벌퍼스트 | (구)일반화물 | 3 | 경상북도 김천시 중앙시장길 38, 1층 (모암동) | 영업중 |
4 | 5 | (주)김구스카이차 | (구)일반화물 | 5 | 경상북도 김천시 농소면 벽소로 2119 | 영업중 |
5 | 6 | (주)김천고속화물 | (구)일반화물 | 1 | 경상북도 김천시 새들1길 2 (백옥동) | 영업중 |
6 | 7 | (주)김천레카 | (구)일반화물 | 5 | 경상북도 김천시 영남대로 1462-1 (부곡동) | 영업중 |
7 | 8 | (주)김천츄레라 | (구)일반화물 | 18 | 경상북도 김천시 대학로 33 (교동) | 영업중 |
8 | 9 | (주)명도티엔에스 | (구)일반화물 | 19 | 경상북도 김천시 아포읍 금계길 171 | 영업중 |
9 | 10 | (주)부곡물류 | (구)일반화물 | 2 | 경상북도 김천시 어모면 산업단지1로 34-6 | 영업중 |
연번 | 업체명 | 면허종류 | 차량대수 | 주소 | 현재운영여부 | |
---|---|---|---|---|---|---|
75 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
76 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
77 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
78 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
79 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
80 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
81 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
82 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
83 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
84 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
연번 | 업체명 | 면허종류 | 차량대수 | 주소 | 현재운영여부 | # duplicates | |
---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 34 |