Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 711 |
Missing cells | 124 |
Missing cells (%) | 4.4% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 23.7 KiB |
Average record size in memory | 34.2 B |
Variable types
Numeric | 2 |
---|---|
Text | 2 |
Dataset
Description | 공정거래위원회의 소비자 민원학습데이터로, 단순문의 소비자 민원 학습데이터 중에 상담에 대한 의도를 파악하는 분쟁유형의 코드성 데이터 입니다. |
---|---|
Author | 공정거래위원회 |
URL | https://www.data.go.kr/data/15098372/fileData.do |
분쟁유형코드(DISPUTE_TYPE_CODE) is highly overall correlated with 상위코드(PARENT_CODE) | High correlation |
상위코드(PARENT_CODE) is highly overall correlated with 분쟁유형코드(DISPUTE_TYPE_CODE) | High correlation |
상위코드(PARENT_CODE) has 62 (8.7%) missing values | Missing |
상위분쟁유형(DISPUTE_TYPE_NAME) has 62 (8.7%) missing values | Missing |
분쟁유형코드(DISPUTE_TYPE_CODE) is highly skewed (γ1 = 20.0833458) | Skewed |
분쟁유형코드(DISPUTE_TYPE_CODE) has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 10:20:00.582747 |
---|---|
Analysis finished | 2023-12-12 10:20:01.715825 |
Duration | 1.13 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
분쟁유형코드(DISPUTE_TYPE_CODE)
Real number (ℝ)
HIGH CORRELATION
  SKEWED
  UNIQUE
 
Distinct | 711 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2.7124309 × 1010 |
Minimum | 1 × 109 |
---|---|
Maximum | 1 × 1012 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.4 KiB |
Quantile statistics
Minimum | 1 × 109 |
---|---|
5-th percentile | 8.0001 × 109 |
Q1 | 9.0027 × 109 |
median | 2.30002 × 1010 |
Q3 | 3.800045 × 1010 |
95-th percentile | 5.70001 × 1010 |
Maximum | 1 × 1012 |
Range | 9.99 × 1011 |
Interquartile range (IQR) | 2.899775 × 1010 |
Descriptive statistics
Standard deviation | 4.0167557 × 1010 |
---|---|
Coefficient of variation (CV) | 1.4808693 |
Kurtosis | 485.85279 |
Mean | 2.7124309 × 1010 |
Median Absolute Deviation (MAD) | 1.39984 × 1010 |
Skewness | 20.083346 |
Sum | 1.9285384 × 1013 |
Variance | 1.6134326 × 1021 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
15000300040 | 1 | 0.1% |
9000400100 | 1 | 0.1% |
9000100060 | 1 | 0.1% |
9000100070 | 1 | 0.1% |
9000200010 | 1 | 0.1% |
9000200020 | 1 | 0.1% |
9000200030 | 1 | 0.1% |
9000200040 | 1 | 0.1% |
9000200050 | 1 | 0.1% |
9000200060 | 1 | 0.1% |
Other values (701) | 701 |
Value | Count | Frequency (%) |
1000000000 | 1 | |
1000100000 | 1 | |
1000100010 | 1 | |
1000100020 | 1 | |
2000000000 | 1 | |
2000100000 | 1 | |
2000100010 | 1 | |
2000100020 | 1 | |
3000000000 | 1 | |
3000100000 | 1 |
Value | Count | Frequency (%) |
1000000000000 | 1 | |
62000100030 | 1 | |
62000100020 | 1 | |
62000100010 | 1 | |
62000100000 | 1 | |
62000000000 | 1 | |
61000100040 | 1 | |
61000100030 | 1 | |
61000100020 | 1 | |
61000100010 | 1 |
Distinct | 654 |
---|---|
Distinct (%) | 92.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.7 KiB |
Length
Max length | 128 |
---|---|
Median length | 68 |
Mean length | 24.279887 |
Min length | 2 |
Characters and Unicode
Total characters | 17263 |
---|---|
Distinct characters | 467 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 611 ? |
---|---|
Unique (%) | 85.9% |
Sample
1st row | 4) 판매자가 구입자의 철회권 행사를 제한하기 위해 임의로 포장을 훼손한 경우 |
---|---|
2nd row | 5) 판매원 신분 허위 판매처 허위인 계약 |
3rd row | 6) 회원제 판매 또는 복합상품 판매 후 일부 계약 불이행 |
4th row | 7) 정기간행물 구독계약을 중도해지한 경우 (서면 계약해지의사 도달일 기준) |
5th row | 8) 도서 음반 정기간행물 계약의 중도해지 시 제공받은 사은품 |
Value | Count | Frequency (%) |
경우 | 126 | 3.0% |
1 | 123 | 3.0% |
2 | 119 | 2.9% |
인한 | 102 | 2.5% |
3 | 87 | 2.1% |
4 | 66 | 1.6% |
업종 | 60 | 1.4% |
발생한 | 57 | 1.4% |
또는 | 56 | 1.4% |
이내에 | 51 | 1.2% |
Other values (1545) | 3294 |
Most occurring characters
Value | Count | Frequency (%) |
3607 | 20.9% | |
) | 710 | 4.1% |
자 | 308 | 1.8% |
의 | 306 | 1.8% |
한 | 274 | 1.6% |
사 | 259 | 1.5% |
이 | 257 | 1.5% |
상 | 252 | 1.5% |
업 | 244 | 1.4% |
1 | 242 | 1.4% |
Other values (457) | 10804 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 11630 | |
Space Separator | 3607 | 20.9% |
Decimal Number | 808 | 4.7% |
Close Punctuation | 710 | 4.1% |
Open Punctuation | 183 | 1.1% |
Other Punctuation | 181 | 1.0% |
Lowercase Letter | 100 | 0.6% |
Uppercase Letter | 27 | 0.2% |
Dash Punctuation | 15 | 0.1% |
Math Symbol | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
자 | 308 | 2.6% |
의 | 306 | 2.6% |
한 | 274 | 2.4% |
사 | 259 | 2.2% |
이 | 257 | 2.2% |
상 | 252 | 2.2% |
업 | 244 | 2.1% |
기 | 209 | 1.8% |
하 | 206 | 1.8% |
인 | 201 | 1.7% |
Other values (403) | 9114 |
Lowercase Letter
Value | Count | Frequency (%) |
i | 13 | |
n | 11 | |
o | 10 | |
e | 10 | |
a | 8 | |
g | 8 | |
r | 7 | 7.0% |
k | 6 | 6.0% |
t | 5 | 5.0% |
p | 4 | 4.0% |
Other values (8) | 18 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 4 | |
R | 4 | |
O | 3 | |
A | 2 | |
S | 2 | |
F | 2 | |
N | 2 | |
T | 2 | |
B | 1 | 3.7% |
L | 1 | 3.7% |
Other values (4) | 4 |
Decimal Number
Value | Count | Frequency (%) |
1 | 242 | |
2 | 155 | |
3 | 119 | |
4 | 88 | 10.9% |
5 | 75 | 9.3% |
6 | 50 | 6.2% |
7 | 30 | 3.7% |
0 | 22 | 2.7% |
8 | 14 | 1.7% |
9 | 13 | 1.6% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 96 | |
. | 75 | |
· | 5 | 2.8% |
: | 3 | 1.7% |
* | 1 | 0.6% |
% | 1 | 0.6% |
Math Symbol
Value | Count | Frequency (%) |
± | 1 | |
+ | 1 |
Space Separator
Value | Count | Frequency (%) |
3607 |
Close Punctuation
Value | Count | Frequency (%) |
) | 710 |
Open Punctuation
Value | Count | Frequency (%) |
( | 183 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 15 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 11630 | |
Common | 5506 | |
Latin | 127 | 0.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
자 | 308 | 2.6% |
의 | 306 | 2.6% |
한 | 274 | 2.4% |
사 | 259 | 2.2% |
이 | 257 | 2.2% |
상 | 252 | 2.2% |
업 | 244 | 2.1% |
기 | 209 | 1.8% |
하 | 206 | 1.8% |
인 | 201 | 1.7% |
Other values (403) | 9114 |
Latin
Value | Count | Frequency (%) |
i | 13 | 10.2% |
n | 11 | 8.7% |
o | 10 | 7.9% |
e | 10 | 7.9% |
a | 8 | 6.3% |
g | 8 | 6.3% |
r | 7 | 5.5% |
k | 6 | 4.7% |
t | 5 | 3.9% |
C | 4 | 3.1% |
Other values (22) | 45 |
Common
Value | Count | Frequency (%) |
3607 | ||
) | 710 | 12.9% |
1 | 242 | 4.4% |
( | 183 | 3.3% |
2 | 155 | 2.8% |
3 | 119 | 2.2% |
/ | 96 | 1.7% |
4 | 88 | 1.6% |
. | 75 | 1.4% |
5 | 75 | 1.4% |
Other values (12) | 156 | 2.8% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 11630 | |
ASCII | 5627 | |
None | 6 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
3607 | ||
) | 710 | 12.6% |
1 | 242 | 4.3% |
( | 183 | 3.3% |
2 | 155 | 2.8% |
3 | 119 | 2.1% |
/ | 96 | 1.7% |
4 | 88 | 1.6% |
. | 75 | 1.3% |
5 | 75 | 1.3% |
Other values (42) | 277 | 4.9% |
Hangul
Value | Count | Frequency (%) |
자 | 308 | 2.6% |
의 | 306 | 2.6% |
한 | 274 | 2.4% |
사 | 259 | 2.2% |
이 | 257 | 2.2% |
상 | 252 | 2.2% |
업 | 244 | 2.1% |
기 | 209 | 1.8% |
하 | 206 | 1.8% |
인 | 201 | 1.7% |
Other values (403) | 9114 |
None
Value | Count | Frequency (%) |
· | 5 | |
± | 1 | 16.7% |
상위코드(PARENT_CODE)
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 185 |
---|---|
Distinct (%) | 28.5% |
Missing | 62 |
Missing (%) | 8.7% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2.6706176 × 1010 |
Minimum | 1 × 109 |
---|---|
Maximum | 1 × 1012 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.4 KiB |
Quantile statistics
Minimum | 1 × 109 |
---|---|
5-th percentile | 8.0001 × 109 |
Q1 | 9.0024 × 109 |
median | 2.30001 × 1010 |
Q3 | 3.80002 × 1010 |
95-th percentile | 5.660004 × 1010 |
Maximum | 1 × 1012 |
Range | 9.99 × 1011 |
Interquartile range (IQR) | 2.89978 × 1010 |
Descriptive statistics
Standard deviation | 4.1655241 × 1010 |
---|---|
Coefficient of variation (CV) | 1.5597606 |
Kurtosis | 461.27369 |
Mean | 2.6706176 × 1010 |
Median Absolute Deviation (MAD) | 1.39989 × 1010 |
Skewness | 19.760268 |
Sum | 1.7332308 × 1013 |
Variance | 1.7351591 × 1021 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
9000000000 | 34 | 4.8% |
9000400000 | 16 | 2.3% |
34000600000 | 12 | 1.7% |
16000100000 | 12 | 1.7% |
38000000000 | 9 | 1.3% |
53000100000 | 9 | 1.3% |
38000100000 | 9 | 1.3% |
15000300000 | 9 | 1.3% |
57000100000 | 8 | 1.1% |
38000300000 | 8 | 1.1% |
Other values (175) | 523 | |
(Missing) | 62 | 8.7% |
Value | Count | Frequency (%) |
1000000000 | 1 | 0.1% |
1000100000 | 2 | 0.3% |
2000000000 | 1 | 0.1% |
2000100000 | 2 | 0.3% |
3000000000 | 1 | 0.1% |
3000100000 | 2 | 0.3% |
4000000000 | 1 | 0.1% |
4000100000 | 1 | 0.1% |
5000000000 | 1 | 0.1% |
5000100000 | 6 |
Value | Count | Frequency (%) |
1000000000000 | 1 | 0.1% |
62000100000 | 3 | |
62000000000 | 1 | 0.1% |
61000100000 | 4 | |
61000000000 | 1 | 0.1% |
60000100000 | 5 | |
60000000000 | 1 | 0.1% |
59000100000 | 3 | |
59000000000 | 1 | 0.1% |
58000100000 | 3 |
MISSING
 
Distinct | 62 |
---|---|
Distinct (%) | 9.6% |
Missing | 62 |
Missing (%) | 8.7% |
Memory size | 5.7 KiB |
Length
Max length | 32 |
---|---|
Median length | 28 |
Mean length | 16.684129 |
Min length | 8 |
Characters and Unicode
Total characters | 10828 |
---|---|
Distinct characters | 162 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 3 ? |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 15. 문화용품·기타(4개 업종) |
---|---|
2nd row | 15. 문화용품·기타(4개 업종) |
3rd row | 15. 문화용품·기타(4개 업종) |
4th row | 15. 문화용품·기타(4개 업종) |
5th row | 15. 문화용품·기타(4개 업종) |
Value | Count | Frequency (%) |
업종 | 591 | |
9 | 173 | 8.0% |
공산품(30개 | 173 | 8.0% |
및 | 82 | 3.8% |
38 | 51 | 2.4% |
의약품 | 51 | 2.4% |
화학제품(10개 | 51 | 2.4% |
품종 | 51 | 2.4% |
34 | 39 | 1.8% |
운수업(9개 | 39 | 1.8% |
Other values (130) | 861 |
Most occurring characters
Value | Count | Frequency (%) |
1519 | 14.0% | |
업 | 929 | 8.6% |
개 | 650 | 6.0% |
. | 649 | 6.0% |
( | 642 | 5.9% |
종 | 642 | 5.9% |
) | 639 | 5.9% |
1 | 418 | 3.9% |
3 | 406 | 3.7% |
품 | 394 | 3.6% |
Other values (152) | 3940 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 5376 | |
Decimal Number | 1956 | 18.1% |
Space Separator | 1519 | 14.0% |
Other Punctuation | 696 | 6.4% |
Open Punctuation | 642 | 5.9% |
Close Punctuation | 639 | 5.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
업 | 929 | |
개 | 650 | 12.1% |
종 | 642 | 11.9% |
품 | 394 | 7.3% |
공 | 226 | 4.2% |
산 | 191 | 3.6% |
비 | 90 | 1.7% |
화 | 83 | 1.5% |
및 | 82 | 1.5% |
스 | 82 | 1.5% |
Other values (137) | 2007 |
Decimal Number
Value | Count | Frequency (%) |
1 | 418 | |
3 | 406 | |
0 | 268 | |
9 | 242 | |
2 | 180 | |
4 | 146 | 7.5% |
5 | 104 | 5.3% |
8 | 88 | 4.5% |
6 | 58 | 3.0% |
7 | 46 | 2.4% |
Other Punctuation
Value | Count | Frequency (%) |
. | 649 | |
· | 47 | 6.8% |
Space Separator
Value | Count | Frequency (%) |
1519 |
Open Punctuation
Value | Count | Frequency (%) |
( | 642 |
Close Punctuation
Value | Count | Frequency (%) |
) | 639 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 5452 | |
Hangul | 5376 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
업 | 929 | |
개 | 650 | 12.1% |
종 | 642 | 11.9% |
품 | 394 | 7.3% |
공 | 226 | 4.2% |
산 | 191 | 3.6% |
비 | 90 | 1.7% |
화 | 83 | 1.5% |
및 | 82 | 1.5% |
스 | 82 | 1.5% |
Other values (137) | 2007 |
Common
Value | Count | Frequency (%) |
1519 | ||
. | 649 | |
( | 642 | |
) | 639 | |
1 | 418 | 7.7% |
3 | 406 | 7.4% |
0 | 268 | 4.9% |
9 | 242 | 4.4% |
2 | 180 | 3.3% |
4 | 146 | 2.7% |
Other values (5) | 343 | 6.3% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 5405 | |
Hangul | 5376 | |
None | 47 | 0.4% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1519 | ||
. | 649 | |
( | 642 | |
) | 639 | |
1 | 418 | 7.7% |
3 | 406 | 7.5% |
0 | 268 | 5.0% |
9 | 242 | 4.5% |
2 | 180 | 3.3% |
4 | 146 | 2.7% |
Other values (4) | 296 | 5.5% |
Hangul
Value | Count | Frequency (%) |
업 | 929 | |
개 | 650 | 12.1% |
종 | 642 | 11.9% |
품 | 394 | 7.3% |
공 | 226 | 4.2% |
산 | 191 | 3.6% |
비 | 90 | 1.7% |
화 | 83 | 1.5% |
및 | 82 | 1.5% |
스 | 82 | 1.5% |
Other values (137) | 2007 |
None
Value | Count | Frequency (%) |
· | 47 |
분쟁유형코드(DISPUTE_TYPE_CODE) | 상위코드(PARENT_CODE) | 상위분쟁유형(DISPUTE_TYPE_NAME) | |
---|---|---|---|
분쟁유형코드(DISPUTE_TYPE_CODE) | 1.000 | 0.705 | 0.000 |
상위코드(PARENT_CODE) | 0.705 | 1.000 | 0.000 |
상위분쟁유형(DISPUTE_TYPE_NAME) | 0.000 | 0.000 | 1.000 |
분쟁유형코드(DISPUTE_TYPE_CODE) | 상위코드(PARENT_CODE) | |
---|---|---|
분쟁유형코드(DISPUTE_TYPE_CODE) | 1.000 | 0.993 |
상위코드(PARENT_CODE) | 0.993 | 1.000 |
분쟁유형코드(DISPUTE_TYPE_CODE) | 분쟁유형(DISPUTE_TYPE_NAME) | 상위코드(PARENT_CODE) | 상위분쟁유형(DISPUTE_TYPE_NAME) | |
---|---|---|---|---|
0 | 15000300040 | 4) 판매자가 구입자의 철회권 행사를 제한하기 위해 임의로 포장을 훼손한 경우 | 15000300000 | 15. 문화용품·기타(4개 업종) |
1 | 15000300050 | 5) 판매원 신분 허위 판매처 허위인 계약 | 15000300000 | 15. 문화용품·기타(4개 업종) |
2 | 15000300060 | 6) 회원제 판매 또는 복합상품 판매 후 일부 계약 불이행 | 15000300000 | 15. 문화용품·기타(4개 업종) |
3 | 15000300070 | 7) 정기간행물 구독계약을 중도해지한 경우 (서면 계약해지의사 도달일 기준) | 15000300000 | 15. 문화용품·기타(4개 업종) |
4 | 15000300080 | 8) 도서 음반 정기간행물 계약의 중도해지 시 제공받은 사은품 | 15000300000 | 15. 문화용품·기타(4개 업종) |
5 | 15000300090 | 9) 청약철회기간 이후 계약 해제 시(법령상 청약철회가 가능한 거래의 경우) | 15000300000 | 15. 문화용품·기타(4개 업종) |
6 | 15000400010 | 1) 구입 후 1개월 이내에 정상적인 사용상태에서 발생한 성능/기능상의 하자로 중요한 수리를 요할 때 | 15000400000 | 15. 문화용품·기타(4개 업종) |
7 | 15000400020 | 2) 품질보증기간 이내에 정상적인 사용상태에서 발생한 성능/기능상의 하자 | 15000400000 | 15. 문화용품·기타(4개 업종) |
8 | 15000400030 | 3) 사용자가 수리 의뢰한 제품을 사업자가 분실했을 경우 | 15000400000 | 15. 문화용품·기타(4개 업종) |
9 | 15000400040 | 4) 부품보유기간 이내에 수리용 부품을 보유하고 있지 않아 발생한 피해 | 15000400000 | 15. 문화용품·기타(4개 업종) |
분쟁유형코드(DISPUTE_TYPE_CODE) | 분쟁유형(DISPUTE_TYPE_NAME) | 상위코드(PARENT_CODE) | 상위분쟁유형(DISPUTE_TYPE_NAME) | |
---|---|---|---|---|
701 | 47000000000 | 47. 자동차운전학원(1개 업종) | <NA> | <NA> |
702 | 48000000000 | 48. 자동차 정비업(1개 업종) | <NA> | <NA> |
703 | 49000000000 | 49. 전자지급수단발행업(1개 업종) | <NA> | <NA> |
704 | 50000000000 | 50. 주차장업(2개 업종) | <NA> | <NA> |
705 | 51000000000 | 51. 주택건설업(1개 업종) | <NA> | <NA> |
706 | 52000000000 | 52. 중고전자제품매매업(1개 업종) | <NA> | <NA> |
707 | 53000000000 | 53. 중고자동차매매업(1개 업종) | <NA> | <NA> |
708 | 54000000000 | 54. 창호공사업(1개 업종) | <NA> | <NA> |
709 | 55000000000 | 55. 청소대행서비스업(1개 업종) | <NA> | <NA> |
710 | 56000000000 | 56. 체육시설업 레저용역업 및 할인회원권업(3개 업종) | <NA> | <NA> |