Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 11 |
Duplicate rows (%) | 11.0% |
Total size in memory | 2.7 KiB |
Average record size in memory | 27.3 B |
Variable types
Categorical | 1 |
---|---|
Text | 1 |
Numeric | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 한국수자원공사 |
URL | https://www.bigdata-environment.kr/user/data_market/detail.do?id=116960f0-1fe6-11eb-8adf-f5453fd1d47b |
Dataset has 11 (11.0%) duplicate rows | Duplicates |
Reproduction
Analysis started | 2024-04-20 16:01:11.504283 |
---|---|
Analysis finished | 2024-04-20 16:01:12.313661 |
Duration | 0.81 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시설명
Categorical
Distinct | 2 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 928.0 B |
20201201 | |
---|---|
20201202 |
Length
Max length | 8 |
---|---|
Median length | 8 |
Mean length | 8 |
Min length | 8 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 20201201 |
---|---|
2nd row | 20201201 |
3rd row | 20201201 |
4th row | 20201201 |
5th row | 20201201 |
Common Values
Value | Count | Frequency (%) |
20201201 | 84 | |
20201202 | 16 | 16.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
20201201 | 84 | |
20201202 | 16 | 16.0% |
공급날짜
Text
Distinct | 62 |
---|---|
Distinct (%) | 62.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 928.0 B |
Value | Count | Frequency (%) |
미금가압장 | 11 | 11.0% |
판교가압장 | 7 | 7.0% |
용인가압장 | 5 | 5.0% |
논산가압장 | 4 | 4.0% |
광명가압장 | 4 | 4.0% |
사등가압장 | 3 | 3.0% |
금가가압장 | 2 | 2.0% |
주산가압장 | 2 | 2.0% |
상무대가압장 | 2 | 2.0% |
낙양가압장 | 2 | 2.0% |
Other values (52) | 58 |
Most occurring characters
Value | Count | Frequency (%) |
장 | 104 | |
가 | 102 | |
압 | 100 | |
미 | 13 | 2.5% |
금 | 13 | 2.5% |
산 | 10 | 1.9% |
교 | 8 | 1.6% |
판 | 7 | 1.4% |
사 | 6 | 1.2% |
용 | 5 | 1.0% |
Other values (72) | 147 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 512 | |
Decimal Number | 3 | 0.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
장 | 104 | |
가 | 102 | |
압 | 100 | |
미 | 13 | 2.5% |
금 | 13 | 2.5% |
산 | 10 | 2.0% |
교 | 8 | 1.6% |
판 | 7 | 1.4% |
사 | 6 | 1.2% |
용 | 5 | 1.0% |
Other values (70) | 144 |
Decimal Number
Value | Count | Frequency (%) |
2 | 2 | |
1 | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 512 | |
Common | 3 | 0.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
장 | 104 | |
가 | 102 | |
압 | 100 | |
미 | 13 | 2.5% |
금 | 13 | 2.5% |
산 | 10 | 2.0% |
교 | 8 | 1.6% |
판 | 7 | 1.4% |
사 | 6 | 1.2% |
용 | 5 | 1.0% |
Other values (70) | 144 |
Common
Value | Count | Frequency (%) |
2 | 2 | |
1 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 512 | |
ASCII | 3 | 0.6% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
장 | 104 | |
가 | 102 | |
압 | 100 | |
미 | 13 | 2.5% |
금 | 13 | 2.5% |
산 | 10 | 2.0% |
교 | 8 | 1.6% |
판 | 7 | 1.4% |
사 | 6 | 1.2% |
용 | 5 | 1.0% |
Other values (70) | 144 |
ASCII
Value | Count | Frequency (%) |
2 | 2 | |
1 | 1 |
공급량
Real number (ℝ)
Distinct | 83 |
---|---|
Distinct (%) | 83.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 183236.31 |
Minimum | 147 |
---|---|
Maximum | 2166500 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 147 |
---|---|
5-th percentile | 1086.85 |
Q1 | 4922.5 |
median | 31630 |
Q3 | 103778 |
95-th percentile | 909045 |
Maximum | 2166500 |
Range | 2166353 |
Interquartile range (IQR) | 98855.5 |
Descriptive statistics
Standard deviation | 415430.52 |
---|---|
Coefficient of variation (CV) | 2.2671845 |
Kurtosis | 13.765339 |
Mean | 183236.31 |
Median Absolute Deviation (MAD) | 29637 |
Skewness | 3.6256015 |
Sum | 18323631 |
Variance | 1.7258251 × 1011 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
362300 | 4 | 4.0% |
45754 | 4 | 4.0% |
95770 | 4 | 4.0% |
2123100 | 2 | 2.0% |
892100 | 2 | 2.0% |
63354 | 2 | 2.0% |
364600 | 2 | 2.0% |
416471 | 2 | 2.0% |
1231000 | 2 | 2.0% |
59288 | 2 | 2.0% |
Other values (73) | 74 |
Value | Count | Frequency (%) |
147 | 1 | |
515 | 1 | |
523 | 1 | |
670 | 1 | |
704 | 1 | |
1107 | 1 | |
1244 | 1 | |
1475 | 1 | |
1580 | 1 | |
1665 | 1 |
Value | Count | Frequency (%) |
2166500 | 1 | 1.0% |
2123100 | 2 | |
1231000 | 2 | |
892100 | 2 | |
467364 | 1 | 1.0% |
416471 | 2 | |
409630 | 2 | |
405568 | 1 | 1.0% |
364600 | 2 | |
362300 | 4 |
시설명 | 공급날짜 | 공급량 | |
---|---|---|---|
시설명 | 1.000 | 0.000 | 0.075 |
공급날짜 | 0.000 | 1.000 | 0.000 |
공급량 | 0.075 | 0.000 | 1.000 |
공급량 | 시설명 | |
---|---|---|
공급량 | 1.000 | 0.057 |
시설명 | 0.057 | 1.000 |
시설명 | 공급날짜 | 공급량 | |
---|---|---|---|
0 | 20201201 | 주산가압장 | 30592 |
1 | 20201201 | 유정가압장 | 4056 |
2 | 20201201 | 논산가압장 | 20169 |
3 | 20201201 | 광명가압장 | 409630 |
4 | 20201201 | 미금가압장 | 95770 |
5 | 20201201 | 신림가압장 | 21872 |
6 | 20201201 | 논산가압장 | 2579 |
7 | 20201201 | 미금가압장 | 95770 |
8 | 20201201 | 수분가압장 | 5028 |
9 | 20201201 | 평촌가압장 | 7325 |
시설명 | 공급날짜 | 공급량 | |
---|---|---|---|
90 | 20201202 | 금가가압장 | 4400 |
91 | 20201202 | 미금가압장 | 364600 |
92 | 20201202 | 광명가압장 | 416471 |
93 | 20201202 | 부곡가압장 | 18691 |
94 | 20201202 | 월야가압장 | 8180 |
95 | 20201202 | 용인가압장 | 44513 |
96 | 20201202 | 미금가압장 | 364600 |
97 | 20201202 | 상무대가압장 | 3707 |
98 | 20201202 | 광명가압장 | 416471 |
99 | 20201202 | 팔도가압장 | 21036 |
Most frequently occurring
시설명 | 공급날짜 | 공급량 | # duplicates | |
---|---|---|---|---|
1 | 20201201 | 미금가압장 | 95770 | 4 |
2 | 20201201 | 미금가압장 | 362300 | 4 |
4 | 20201201 | 용인가압장 | 45754 | 4 |
0 | 20201201 | 광명가압장 | 409630 | 2 |
3 | 20201201 | 사등가압장 | 59288 | 2 |
5 | 20201201 | 의정부가압장 | 63354 | 2 |
6 | 20201201 | 판교가압장 | 892100 | 2 |
7 | 20201201 | 판교가압장 | 1231000 | 2 |
8 | 20201201 | 판교가압장 | 2123100 | 2 |
9 | 20201202 | 광명가압장 | 416471 | 2 |