Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 256 |
Missing cells | 946 |
Missing cells (%) | 61.6% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.4% |
Total size in memory | 12.1 KiB |
Average record size in memory | 48.5 B |
Variable types
Text | 4 |
---|---|
Categorical | 2 |
Dataset
Description | 경상남도 사천시 관내에 경질유, 중질유 사용업체에 관한 데이터 입니다.(상호명, 주소, 사용연료, 생산품, 연간사용량) |
---|---|
Author | 경상남도 사천시 |
URL | https://bigdata.gyeongnam.go.kr/index.gn?menuCd=DOM_000000114002001000&publicdatapk=15107850 |
Dataset has 1 (0.4%) duplicate rows | Duplicates |
데이터기준일자 is highly overall correlated with 사용연료 | High correlation |
사용연료 is highly overall correlated with 데이터기준일자 | High correlation |
사용연료 is highly imbalanced (78.1%) | Imbalance |
데이터기준일자 is highly imbalanced (71.9%) | Imbalance |
상호명 has 234 (91.4%) missing values | Missing |
주소 has 234 (91.4%) missing values | Missing |
생산품 has 241 (94.1%) missing values | Missing |
연간 사용량 has 237 (92.6%) missing values | Missing |
Reproduction
Analysis started | 2023-12-11 00:20:36.751717 |
---|---|
Analysis finished | 2023-12-11 00:20:37.334506 |
Duration | 0.58 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
상호명
Text
MISSING
 
Distinct | 21 |
---|---|
Distinct (%) | 95.5% |
Missing | 234 |
Missing (%) | 91.4% |
Memory size | 2.1 KiB |
Value | Count | Frequency (%) |
현대종합정비 | 2 | 8.0% |
삼천포종합정비(주 | 1 | 4.0% |
굿프로모터스 | 1 | 4.0% |
인터내셔널돔하우스(주 | 1 | 4.0% |
삼육비철 | 1 | 4.0% |
㈜굿웰바이오 | 1 | 4.0% |
주)세명공업 | 1 | 4.0% |
주식회사 | 1 | 4.0% |
제일 | 1 | 4.0% |
농업회사법인 | 1 | 4.0% |
Other values (14) | 14 |
Most occurring characters
Value | Count | Frequency (%) |
합 | 10 | 5.7% |
종 | 9 | 5.1% |
비 | 9 | 5.1% |
정 | 7 | 4.0% |
스 | 6 | 3.4% |
사 | 6 | 3.4% |
주 | 5 | 2.9% |
천 | 4 | 2.3% |
( | 4 | 2.3% |
) | 4 | 2.3% |
Other values (81) | 111 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 159 | |
Open Punctuation | 4 | 2.3% |
Close Punctuation | 4 | 2.3% |
Space Separator | 3 | 1.7% |
Other Symbol | 3 | 1.7% |
Decimal Number | 2 | 1.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
합 | 10 | 6.3% |
종 | 9 | 5.7% |
비 | 9 | 5.7% |
정 | 7 | 4.4% |
스 | 6 | 3.8% |
사 | 6 | 3.8% |
주 | 5 | 3.1% |
천 | 4 | 2.5% |
터 | 3 | 1.9% |
공 | 3 | 1.9% |
Other values (75) | 97 |
Decimal Number
Value | Count | Frequency (%) |
3 | 1 | |
1 | 1 |
Open Punctuation
Value | Count | Frequency (%) |
( | 4 |
Close Punctuation
Value | Count | Frequency (%) |
) | 4 |
Space Separator
Value | Count | Frequency (%) |
3 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 162 | |
Common | 13 | 7.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
합 | 10 | 6.2% |
종 | 9 | 5.6% |
비 | 9 | 5.6% |
정 | 7 | 4.3% |
스 | 6 | 3.7% |
사 | 6 | 3.7% |
주 | 5 | 3.1% |
천 | 4 | 2.5% |
터 | 3 | 1.9% |
공 | 3 | 1.9% |
Other values (76) | 100 |
Common
Value | Count | Frequency (%) |
( | 4 | |
) | 4 | |
3 | ||
3 | 1 | 7.7% |
1 | 1 | 7.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 159 | |
ASCII | 13 | 7.4% |
None | 3 | 1.7% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
합 | 10 | 6.3% |
종 | 9 | 5.7% |
비 | 9 | 5.7% |
정 | 7 | 4.4% |
스 | 6 | 3.8% |
사 | 6 | 3.8% |
주 | 5 | 3.1% |
천 | 4 | 2.5% |
터 | 3 | 1.9% |
공 | 3 | 1.9% |
Other values (75) | 97 |
ASCII
Value | Count | Frequency (%) |
( | 4 | |
) | 4 | |
3 | ||
3 | 1 | 7.7% |
1 | 1 | 7.7% |
None
Value | Count | Frequency (%) |
㈜ | 3 |
주소
Text
MISSING
 
Distinct | 22 |
---|---|
Distinct (%) | 100.0% |
Missing | 234 |
Missing (%) | 91.4% |
Memory size | 2.1 KiB |
Length
Max length | 33 |
---|---|
Median length | 28 |
Mean length | 22.772727 |
Min length | 19 |
Characters and Unicode
Total characters | 501 |
---|---|
Distinct characters | 73 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 22 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 경상남도 사천시 곤양면 구고속도로 1636 |
---|---|
2nd row | 경상남도 사천시 남일로 304 (향촌동) |
3rd row | 경상남도 사천시 삼천포대교로 577 (좌룡동) |
4th row | 경상남도 사천시 정동면 진삼로 1206 |
5th row | 경상남도 사천시 환경길 71 (사등동) |
Value | Count | Frequency (%) |
경상남도 | 22 | |
사천시 | 22 | |
축동면 | 4 | 3.5% |
사천읍 | 3 | 2.7% |
곤명면 | 3 | 2.7% |
사남면 | 3 | 2.7% |
가산리 | 2 | 1.8% |
경서대로 | 2 | 1.8% |
구암두문로 | 2 | 1.8% |
곤양면 | 2 | 1.8% |
Other values (46) | 48 |
Most occurring characters
Value | Count | Frequency (%) |
93 | ||
사 | 30 | 6.0% |
천 | 28 | 5.6% |
남 | 26 | 5.2% |
경 | 25 | 5.0% |
도 | 23 | 4.6% |
상 | 22 | 4.4% |
시 | 22 | 4.4% |
1 | 15 | 3.0% |
2 | 15 | 3.0% |
Other values (63) | 202 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 315 | |
Space Separator | 93 | 18.6% |
Decimal Number | 77 | 15.4% |
Dash Punctuation | 6 | 1.2% |
Close Punctuation | 5 | 1.0% |
Open Punctuation | 5 | 1.0% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
사 | 30 | 9.5% |
천 | 28 | 8.9% |
남 | 26 | 8.3% |
경 | 25 | 7.9% |
도 | 23 | 7.3% |
상 | 22 | 7.0% |
시 | 22 | 7.0% |
면 | 15 | 4.8% |
로 | 14 | 4.4% |
동 | 11 | 3.5% |
Other values (49) | 99 |
Decimal Number
Value | Count | Frequency (%) |
1 | 15 | |
2 | 15 | |
4 | 11 | |
6 | 7 | |
5 | 7 | |
8 | 6 | 7.8% |
7 | 5 | 6.5% |
3 | 5 | 6.5% |
0 | 4 | 5.2% |
9 | 2 | 2.6% |
Space Separator
Value | Count | Frequency (%) |
93 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 6 |
Close Punctuation
Value | Count | Frequency (%) |
) | 5 |
Open Punctuation
Value | Count | Frequency (%) |
( | 5 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 315 | |
Common | 186 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
사 | 30 | 9.5% |
천 | 28 | 8.9% |
남 | 26 | 8.3% |
경 | 25 | 7.9% |
도 | 23 | 7.3% |
상 | 22 | 7.0% |
시 | 22 | 7.0% |
면 | 15 | 4.8% |
로 | 14 | 4.4% |
동 | 11 | 3.5% |
Other values (49) | 99 |
Common
Value | Count | Frequency (%) |
93 | ||
1 | 15 | 8.1% |
2 | 15 | 8.1% |
4 | 11 | 5.9% |
6 | 7 | 3.8% |
5 | 7 | 3.8% |
- | 6 | 3.2% |
8 | 6 | 3.2% |
7 | 5 | 2.7% |
3 | 5 | 2.7% |
Other values (4) | 16 | 8.6% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 315 | |
ASCII | 186 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
93 | ||
1 | 15 | 8.1% |
2 | 15 | 8.1% |
4 | 11 | 5.9% |
6 | 7 | 3.8% |
5 | 7 | 3.8% |
- | 6 | 3.2% |
8 | 6 | 3.2% |
7 | 5 | 2.7% |
3 | 5 | 2.7% |
Other values (4) | 16 | 8.6% |
Hangul
Value | Count | Frequency (%) |
사 | 30 | 9.5% |
천 | 28 | 8.9% |
남 | 26 | 8.3% |
경 | 25 | 7.9% |
도 | 23 | 7.3% |
상 | 22 | 7.0% |
시 | 22 | 7.0% |
면 | 15 | 4.8% |
로 | 14 | 4.4% |
동 | 11 | 3.5% |
Other values (49) | 99 |
사용연료
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 2.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.1 KiB |
<NA> | |
---|---|
경유 | 13 |
등유 | 5 |
중유C | 2 |
경유, 중유C | 1 |
Length
Max length | 7 |
---|---|
Median length | 4 |
Mean length | 3.875 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.8% |
Sample
1st row | 경유 |
---|---|
2nd row | 경유 |
3rd row | 경유 |
4th row | 경유 |
5th row | 경유 |
Common Values
Value | Count | Frequency (%) |
<NA> | 234 | |
경유 | 13 | 5.1% |
등유 | 5 | 2.0% |
중유C | 2 | 0.8% |
경유, 중유C | 1 | 0.4% |
부생연료유1호 | 1 | 0.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 234 | |
경유 | 14 | 5.4% |
등유 | 5 | 1.9% |
중유c | 3 | 1.2% |
부생연료유1호 | 1 | 0.4% |
생산품
Text
MISSING
 
Distinct | 14 |
---|---|
Distinct (%) | 93.3% |
Missing | 241 |
Missing (%) | 94.1% |
Memory size | 2.1 KiB |
Length
Max length | 16 |
---|---|
Median length | 8 |
Mean length | 6.4666667 |
Min length | 1 |
Characters and Unicode
Total characters | 97 |
---|---|
Distinct characters | 51 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 13 ? |
---|---|
Unique (%) | 86.7% |
Sample
1st row | 정비자동차 |
---|---|
2nd row | 항공기, 항공기부품, 건설기계 |
3rd row | 도장완료된 자동차 |
4th row | 수리된 자동차 |
5th row | 도장완료된 자동차 |
Value | Count | Frequency (%) |
자동차 | 4 | |
도장완료된 | 2 | 8.3% |
항공기부품 | 2 | 8.3% |
분말활성탄 | 1 | 4.2% |
목재펠릿 | 1 | 4.2% |
정제유 | 1 | 4.2% |
재생수지칩 | 1 | 4.2% |
온수 | 1 | 4.2% |
및 | 1 | 4.2% |
스팀 | 1 | 4.2% |
Other values (9) | 9 |
Most occurring characters
Value | Count | Frequency (%) |
9 | 9.3% | |
자 | 5 | 5.2% |
동 | 5 | 5.2% |
차 | 5 | 5.2% |
기 | 5 | 5.2% |
품 | 3 | 3.1% |
된 | 3 | 3.1% |
수 | 3 | 3.1% |
항 | 3 | 3.1% |
공 | 3 | 3.1% |
Other values (41) | 53 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 85 | |
Space Separator | 9 | 9.3% |
Other Punctuation | 3 | 3.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
자 | 5 | 5.9% |
동 | 5 | 5.9% |
차 | 5 | 5.9% |
기 | 5 | 5.9% |
품 | 3 | 3.5% |
된 | 3 | 3.5% |
수 | 3 | 3.5% |
항 | 3 | 3.5% |
공 | 3 | 3.5% |
부 | 3 | 3.5% |
Other values (39) | 47 |
Space Separator
Value | Count | Frequency (%) |
9 |
Other Punctuation
Value | Count | Frequency (%) |
, | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 85 | |
Common | 12 | 12.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
자 | 5 | 5.9% |
동 | 5 | 5.9% |
차 | 5 | 5.9% |
기 | 5 | 5.9% |
품 | 3 | 3.5% |
된 | 3 | 3.5% |
수 | 3 | 3.5% |
항 | 3 | 3.5% |
공 | 3 | 3.5% |
부 | 3 | 3.5% |
Other values (39) | 47 |
Common
Value | Count | Frequency (%) |
9 | ||
, | 3 | 25.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 85 | |
ASCII | 12 | 12.4% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
9 | ||
, | 3 | 25.0% |
Hangul
Value | Count | Frequency (%) |
자 | 5 | 5.9% |
동 | 5 | 5.9% |
차 | 5 | 5.9% |
기 | 5 | 5.9% |
품 | 3 | 3.5% |
된 | 3 | 3.5% |
수 | 3 | 3.5% |
항 | 3 | 3.5% |
공 | 3 | 3.5% |
부 | 3 | 3.5% |
Other values (39) | 47 |
연간 사용량
Text
MISSING
 
Distinct | 16 |
---|---|
Distinct (%) | 84.2% |
Missing | 237 |
Missing (%) | 92.6% |
Memory size | 2.1 KiB |
Value | Count | Frequency (%) |
6,000l | 4 | |
2,400l | 1 | 5.3% |
56,680l | 1 | 5.3% |
9,648l | 1 | 5.3% |
26,640l | 1 | 5.3% |
17,760l | 1 | 5.3% |
791,138l | 1 | 5.3% |
39,120l | 1 | 5.3% |
1,200l | 1 | 5.3% |
540,000l | 1 | 5.3% |
Other values (6) | 6 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 35 | |
L | 18 | |
, | 17 | |
6 | 12 | 9.8% |
4 | 7 | 5.7% |
2 | 6 | 4.9% |
9 | 6 | 4.9% |
1 | 5 | 4.1% |
5 | 4 | 3.3% |
8 | 4 | 3.3% |
Other values (4) | 9 | 7.3% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 86 | |
Uppercase Letter | 18 | 14.6% |
Other Punctuation | 17 | 13.8% |
Lowercase Letter | 2 | 1.6% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 35 | |
6 | 12 | 14.0% |
4 | 7 | 8.1% |
2 | 6 | 7.0% |
9 | 6 | 7.0% |
1 | 5 | 5.8% |
5 | 4 | 4.7% |
8 | 4 | 4.7% |
7 | 4 | 4.7% |
3 | 3 | 3.5% |
Lowercase Letter
Value | Count | Frequency (%) |
k | 1 | |
g | 1 |
Uppercase Letter
Value | Count | Frequency (%) |
L | 18 |
Other Punctuation
Value | Count | Frequency (%) |
, | 17 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 103 | |
Latin | 20 | 16.3% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 35 | |
, | 17 | |
6 | 12 | 11.7% |
4 | 7 | 6.8% |
2 | 6 | 5.8% |
9 | 6 | 5.8% |
1 | 5 | 4.9% |
5 | 4 | 3.9% |
8 | 4 | 3.9% |
7 | 4 | 3.9% |
Latin
Value | Count | Frequency (%) |
L | 18 | |
k | 1 | 5.0% |
g | 1 | 5.0% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 123 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 35 | |
L | 18 | |
, | 17 | |
6 | 12 | 9.8% |
4 | 7 | 5.7% |
2 | 6 | 4.9% |
9 | 6 | 4.9% |
1 | 5 | 4.1% |
5 | 4 | 3.3% |
8 | 4 | 3.3% |
Other values (4) | 9 | 7.3% |
데이터기준일자
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 1.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.1 KiB |
<NA> | |
---|---|
2022-11-02 | 21 |
2022-11-01 | 1 |
Length
Max length | 10 |
---|---|
Median length | 4 |
Mean length | 4.515625 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.4% |
Sample
1st row | 2022-11-02 |
---|---|
2nd row | 2022-11-02 |
3rd row | 2022-11-02 |
4th row | 2022-11-02 |
5th row | 2022-11-02 |
Common Values
Value | Count | Frequency (%) |
<NA> | 234 | |
2022-11-02 | 21 | 8.2% |
2022-11-01 | 1 | 0.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 234 | |
2022-11-02 | 21 | 8.2% |
2022-11-01 | 1 | 0.4% |
상호명 | 주소 | 사용연료 | 생산품 | 연간 사용량 | 데이터기준일자 | |
---|---|---|---|---|---|---|
상호명 | 1.000 | 1.000 | 0.935 | 0.986 | 0.966 | 1.000 |
주소 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
사용연료 | 0.935 | 1.000 | 1.000 | 1.000 | 0.977 | 1.000 |
생산품 | 0.986 | 1.000 | 1.000 | 1.000 | 0.819 | NaN |
연간 사용량 | 0.966 | 1.000 | 0.977 | 0.819 | 1.000 | NaN |
데이터기준일자 | 1.000 | 1.000 | 1.000 | NaN | NaN | 1.000 |
데이터기준일자 | 사용연료 | |
---|---|---|
데이터기준일자 | 1.000 | 0.922 |
사용연료 | 0.922 | 1.000 |
사용연료 | 데이터기준일자 | |
---|---|---|
사용연료 | 1.000 | 0.922 |
데이터기준일자 | 0.922 | 1.000 |
상호명 | 주소 | 사용연료 | 생산품 | 연간 사용량 | 데이터기준일자 | |
---|---|---|---|---|---|---|
0 | 평화종합정비 | 경상남도 사천시 곤양면 구고속도로 1636 | 경유 | <NA> | 2,400L | 2022-11-02 |
1 | 하이종합정비 | 경상남도 사천시 남일로 304 (향촌동) | 경유 | <NA> | 39,120L | 2022-11-02 |
2 | 삼천포종합정비(주) | 경상남도 사천시 삼천포대교로 577 (좌룡동) | 경유 | <NA> | 56,680L | 2022-11-02 |
3 | 베스트종합정비 | 경상남도 사천시 정동면 진삼로 1206 | 경유 | 정비자동차 | 6,000L | 2022-11-02 |
4 | 사천시 자원회수센터 | 경상남도 사천시 환경길 71 (사등동) | 경유 | <NA> | 9,648L | 2022-11-02 |
5 | 공군제3훈련비행단 | 경상남도 사천시 사천읍 사천대로 1891-46 | 경유 | 항공기, 항공기부품, 건설기계 | 6,000L | 2022-11-02 |
6 | 현대종합정비 | 경상남도 사천시 사천읍 구암두문로 154-32 | 경유 | 도장완료된 자동차 | 26,640L | 2022-11-02 |
7 | 신세계종합1급정비공장 | 경상남도 사천시 하궁지길 73 (궁지동) | 경유 | 수리된 자동차 | 6,000L | 2022-11-02 |
8 | 사천자동차종합검사소 | 경상남도 사천시 사천읍 구암두문로 154-42 | 경유 | 도장완료된 자동차 | 17,760L | 2022-11-02 |
9 | 송암농축산 | 경상남도 사천시 사남면 송암길 75 | 경유 | 버섯 | 791,138L | 2022-11-02 |
상호명 | 주소 | 사용연료 | 생산품 | 연간 사용량 | 데이터기준일자 | |
---|---|---|---|---|---|---|
246 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
247 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
248 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
249 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
250 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
251 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
252 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
253 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
254 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
255 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
상호명 | 주소 | 사용연료 | 생산품 | 연간 사용량 | 데이터기준일자 | # duplicates | |
---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 234 |