Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 303 |
Missing cells | 206 |
Missing cells (%) | 8.5% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 19.4 KiB |
Average record size in memory | 65.4 B |
Variable types
Categorical | 5 |
---|---|
Text | 3 |
Dataset
Description | 파일 다운로드 |
---|---|
Author | 서울교통공사 |
URL | https://data.seoul.go.kr/dataList/OA-2732/F/1/datasetView.do |
측정 지점 is highly overall correlated with 측 정 항 목.4 | High correlation |
측 정 항 목.4 is highly overall correlated with 측정 지점 | High correlation |
시 설 명 (역사명) has 206 (68.0%) missing values | Missing |
Reproduction
Analysis started | 2024-04-29 22:00:15.739409 |
---|---|
Analysis finished | 2024-04-29 22:00:16.330962 |
Duration | 0.59 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
호선
Categorical
Distinct | 5 |
---|---|
Distinct (%) | 1.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
2 | |
---|---|
3 | |
4 | |
1 | |
<NA> | 2 |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 1.019802 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
2 | 113 | |
3 | 90 | |
4 | 68 | |
1 | 30 | 9.9% |
<NA> | 2 | 0.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2 | 113 | |
3 | 90 | |
4 | 68 | |
1 | 30 | 9.9% |
na | 2 | 0.7% |
시 설 명 (역사명)
Text
MISSING
 
Distinct | 88 |
---|---|
Distinct (%) | 90.7% |
Missing | 206 |
Missing (%) | 68.0% |
Memory size | 2.5 KiB |
Value | Count | Frequency (%) |
신 | 5 | 3.4% |
대 | 5 | 3.4% |
동대문 | 4 | 2.7% |
사 | 3 | 2.0% |
당 | 3 | 2.0% |
수 | 3 | 2.0% |
청 | 3 | 2.0% |
아 | 2 | 1.4% |
삼 | 2 | 1.4% |
시 | 2 | 1.4% |
Other values (99) | 115 |
Most occurring characters
Value | Count | Frequency (%) |
135 | ||
대 | 17 | 4.0% |
신 | 13 | 3.1% |
동 | 13 | 3.1% |
구 | 11 | 2.6% |
로 | 10 | 2.4% |
입 | 7 | 1.7% |
문 | 7 | 1.7% |
가 | 6 | 1.4% |
청 | 6 | 1.4% |
Other values (110) | 198 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 279 | |
Space Separator | 135 | |
Decimal Number | 6 | 1.4% |
Control | 3 | 0.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
대 | 17 | 6.1% |
신 | 13 | 4.7% |
동 | 13 | 4.7% |
구 | 11 | 3.9% |
로 | 10 | 3.6% |
입 | 7 | 2.5% |
문 | 7 | 2.5% |
가 | 6 | 2.2% |
청 | 6 | 2.2% |
지 | 5 | 1.8% |
Other values (105) | 184 |
Decimal Number
Value | Count | Frequency (%) |
3 | 4 | |
5 | 1 | 16.7% |
4 | 1 | 16.7% |
Space Separator
Value | Count | Frequency (%) |
135 |
Control
Value | Count | Frequency (%) |
3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 279 | |
Common | 144 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
대 | 17 | 6.1% |
신 | 13 | 4.7% |
동 | 13 | 4.7% |
구 | 11 | 3.9% |
로 | 10 | 3.6% |
입 | 7 | 2.5% |
문 | 7 | 2.5% |
가 | 6 | 2.2% |
청 | 6 | 2.2% |
지 | 5 | 1.8% |
Other values (105) | 184 |
Common
Value | Count | Frequency (%) |
135 | ||
3 | 4 | 2.8% |
3 | 2.1% | |
5 | 1 | 0.7% |
4 | 1 | 0.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 279 | |
ASCII | 144 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
135 | ||
3 | 4 | 2.8% |
3 | 2.1% | |
5 | 1 | 0.7% |
4 | 1 | 0.7% |
Hangul
Value | Count | Frequency (%) |
대 | 17 | 6.1% |
신 | 13 | 4.7% |
동 | 13 | 4.7% |
구 | 11 | 3.9% |
로 | 10 | 3.6% |
입 | 7 | 2.5% |
문 | 7 | 2.5% |
가 | 6 | 2.2% |
청 | 6 | 2.2% |
지 | 5 | 1.8% |
Other values (105) | 184 |
측정 지점
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
평 균 | |
---|---|
승강장 | |
대합실 | |
환승통로 | |
<NA> | 1 |
Length
Max length | 6 |
---|---|
Median length | 3 |
Mean length | 3.3663366 |
Min length | 3 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.7% |
Sample
1st row | <NA> |
---|---|
2nd row | 공기질 기준 |
3rd row | 평 균 |
4th row | 승강장 |
5th row | 대합실 |
Common Values
Value | Count | Frequency (%) |
평 균 | 97 | |
승강장 | 97 | |
대합실 | 97 | |
환승통로 | 10 | 3.3% |
<NA> | 1 | 0.3% |
공기질 기준 | 1 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
평 | 97 | |
균 | 97 | |
승강장 | 97 | |
대합실 | 97 | |
환승통로 | 10 | 2.5% |
na | 1 | 0.2% |
공기질 | 1 | 0.2% |
기준 | 1 | 0.2% |
측 정 항 목
Text
Distinct | 232 |
---|---|
Distinct (%) | 76.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
Value | Count | Frequency (%) |
88.8 | 4 | 1.3% |
86.9 | 4 | 1.3% |
93.7 | 4 | 1.3% |
81 | 3 | 1.0% |
94.1 | 3 | 1.0% |
94 | 3 | 1.0% |
101.3 | 3 | 1.0% |
95 | 3 | 1.0% |
105.1 | 3 | 1.0% |
88.4 | 3 | 1.0% |
Other values (222) | 270 |
Most occurring characters
Value | Count | Frequency (%) |
. | 273 | |
1 | 194 | |
8 | 147 | |
9 | 134 | |
7 | 86 | 6.8% |
0 | 80 | 6.3% |
3 | 70 | 5.6% |
2 | 69 | 5.5% |
5 | 68 | 5.4% |
4 | 67 | 5.3% |
Other values (8) | 72 | 5.7% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 980 | |
Other Punctuation | 274 | 21.7% |
Other Symbol | 2 | 0.2% |
Other Letter | 2 | 0.2% |
Uppercase Letter | 2 | 0.2% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 194 | |
8 | 147 | |
9 | 134 | |
7 | 86 | |
0 | 80 | |
3 | 70 | 7.1% |
2 | 69 | 7.0% |
5 | 68 | 6.9% |
4 | 67 | 6.8% |
6 | 65 | 6.6% |
Other Punctuation
Value | Count | Frequency (%) |
. | 273 | |
/ | 1 | 0.4% |
Other Symbol
Value | Count | Frequency (%) |
㎍ | 1 | |
㎥ | 1 |
Other Letter
Value | Count | Frequency (%) |
이 | 1 | |
하 | 1 |
Uppercase Letter
Value | Count | Frequency (%) |
P | 1 | |
M | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 1256 | |
Hangul | 2 | 0.2% |
Latin | 2 | 0.2% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
. | 273 | |
1 | 194 | |
8 | 147 | |
9 | 134 | |
7 | 86 | 6.8% |
0 | 80 | 6.4% |
3 | 70 | 5.6% |
2 | 69 | 5.5% |
5 | 68 | 5.4% |
4 | 67 | 5.3% |
Other values (4) | 68 | 5.4% |
Hangul
Value | Count | Frequency (%) |
이 | 1 | |
하 | 1 |
Latin
Value | Count | Frequency (%) |
P | 1 | |
M | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 1256 | |
CJK Compat | 2 | 0.2% |
Hangul | 2 | 0.2% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
. | 273 | |
1 | 194 | |
8 | 147 | |
9 | 134 | |
7 | 86 | 6.8% |
0 | 80 | 6.4% |
3 | 70 | 5.6% |
2 | 69 | 5.5% |
5 | 68 | 5.4% |
4 | 67 | 5.3% |
Other values (4) | 68 | 5.4% |
CJK Compat
Value | Count | Frequency (%) |
㎍ | 1 | |
㎥ | 1 |
Hangul
Value | Count | Frequency (%) |
이 | 1 | |
하 | 1 |
측 정 항 목.1
Text
Distinct | 217 |
---|---|
Distinct (%) | 71.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
Value | Count | Frequency (%) |
507 | 5 | 1.7% |
468 | 4 | 1.3% |
488 | 4 | 1.3% |
482 | 4 | 1.3% |
587 | 4 | 1.3% |
484 | 3 | 1.0% |
534 | 3 | 1.0% |
603 | 3 | 1.0% |
570 | 3 | 1.0% |
464 | 3 | 1.0% |
Other values (207) | 267 |
Most occurring characters
Value | Count | Frequency (%) |
5 | 218 | |
4 | 186 | |
6 | 106 | |
7 | 71 | 6.9% |
0 | 71 | 6.9% |
8 | 69 | 6.7% |
3 | 65 | 6.3% |
9 | 61 | 5.9% |
1 | 59 | 5.8% |
2 | 57 | 5.6% |
Other values (8) | 63 | 6.1% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 963 | |
Other Punctuation | 56 | 5.5% |
Lowercase Letter | 3 | 0.3% |
Other Letter | 2 | 0.2% |
Uppercase Letter | 2 | 0.2% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
5 | 218 | |
4 | 186 | |
6 | 106 | |
7 | 71 | 7.4% |
0 | 71 | 7.4% |
8 | 69 | 7.2% |
3 | 65 | 6.7% |
9 | 61 | 6.3% |
1 | 59 | 6.1% |
2 | 57 | 5.9% |
Other Punctuation
Value | Count | Frequency (%) |
. | 55 | |
, | 1 | 1.8% |
Lowercase Letter
Value | Count | Frequency (%) |
p | 2 | |
m | 1 |
Other Letter
Value | Count | Frequency (%) |
이 | 1 | |
하 | 1 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 1 | |
O | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 1019 | |
Latin | 5 | 0.5% |
Hangul | 2 | 0.2% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
5 | 218 | |
4 | 186 | |
6 | 106 | |
7 | 71 | 7.0% |
0 | 71 | 7.0% |
8 | 69 | 6.8% |
3 | 65 | 6.4% |
9 | 61 | 6.0% |
1 | 59 | 5.8% |
2 | 57 | 5.6% |
Other values (2) | 56 | 5.5% |
Latin
Value | Count | Frequency (%) |
p | 2 | |
m | 1 | |
C | 1 | |
O | 1 |
Hangul
Value | Count | Frequency (%) |
이 | 1 | |
하 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 1024 | |
Hangul | 2 | 0.2% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
5 | 218 | |
4 | 186 | |
6 | 106 | |
7 | 71 | 6.9% |
0 | 71 | 6.9% |
8 | 69 | 6.7% |
3 | 65 | 6.3% |
9 | 61 | 6.0% |
1 | 59 | 5.8% |
2 | 57 | 5.6% |
Other values (6) | 61 | 6.0% |
Hangul
Value | Count | Frequency (%) |
이 | 1 | |
하 | 1 |
측 정 항 목.2
Categorical
Distinct | 44 |
---|---|
Distinct (%) | 14.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
13 | |
---|---|
13.1 | |
13.2 | |
12.9 | |
13.3 | |
Other values (39) |
Length
Max length | 8 |
---|---|
Median length | 4 |
Mean length | 3.6237624 |
Min length | 2 |
Unique
Unique | 20 ? |
---|---|
Unique (%) | 6.6% |
Sample
1st row | HCHO |
---|---|
2nd row | 100㎍/㎥이하 |
3rd row | 19.2 |
4th row | 12.7 |
5th row | 25.6 |
Common Values
Value | Count | Frequency (%) |
13 | 51 | |
13.1 | 45 | |
13.2 | 35 | |
12.9 | 22 | 7.3% |
13.3 | 18 | 5.9% |
13.5 | 18 | 5.9% |
13.4 | 17 | 5.6% |
12.8 | 13 | 4.3% |
25.9 | 9 | 3.0% |
13.7 | 8 | 2.6% |
Other values (34) | 67 |
Length
Value | Count | Frequency (%) |
13 | 51 | |
13.1 | 45 | |
13.2 | 35 | |
12.9 | 22 | 7.3% |
13.3 | 18 | 5.9% |
13.5 | 18 | 5.9% |
13.4 | 17 | 5.6% |
12.8 | 13 | 4.3% |
25.9 | 9 | 3.0% |
26 | 8 | 2.6% |
Other values (34) | 67 |
측 정 항 목.3
Categorical
Distinct | 19 |
---|---|
Distinct (%) | 6.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
0.9 | |
---|---|
1 | |
0.8 | |
1.1 | |
0.2 | |
Other values (14) |
Length
Max length | 7 |
---|---|
Median length | 3 |
Mean length | 2.7392739 |
Min length | 1 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 1.3% |
Sample
1st row | CO |
---|---|
2nd row | 10ppm이하 |
3rd row | 0.8 |
4th row | 0.7 |
5th row | 0.8 |
Common Values
Value | Count | Frequency (%) |
0.9 | 47 | |
1 | 41 | |
0.8 | 37 | |
1.1 | 32 | |
0.2 | 27 | |
0.7 | 23 | |
1.2 | 22 | |
1.3 | 14 | 4.6% |
0.3 | 13 | 4.3% |
0.6 | 12 | 4.0% |
Other values (9) | 35 |
Length
Value | Count | Frequency (%) |
0.9 | 47 | |
1 | 41 | |
0.8 | 37 | |
1.1 | 32 | |
0.2 | 27 | |
0.7 | 23 | |
1.2 | 22 | |
1.3 | 14 | 4.6% |
0.3 | 13 | 4.3% |
0.6 | 12 | 4.0% |
Other values (9) | 35 |
측 정 항 목.4
Categorical
HIGH CORRELATION
 
Distinct | 21 |
---|---|
Distinct (%) | 6.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
0.0008 | |
---|---|
0.0004 | |
0.0013 | |
0.0012 | |
0.0006 | |
Other values (16) |
Length
Max length | 10 |
---|---|
Median length | 6 |
Mean length | 5.970297 |
Min length | 2 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 1.3% |
Sample
1st row | 석면 |
---|---|
2nd row | 0.01개/cc이하 |
3rd row | 0.0007 |
4th row | 0.0009 |
5th row | 0.0004 |
Common Values
Value | Count | Frequency (%) |
0.0008 | 109 | |
0.0004 | 43 | 14.2% |
0.0013 | 29 | 9.6% |
0.0012 | 21 | 6.9% |
0.0006 | 17 | 5.6% |
0.0009 | 17 | 5.6% |
0.0017 | 15 | 5.0% |
0.0011 | 12 | 4.0% |
0.001 | 9 | 3.0% |
0.0007 | 6 | 2.0% |
Other values (11) | 25 | 8.3% |
Length
Value | Count | Frequency (%) |
0.0008 | 109 | |
0.0004 | 43 | 14.2% |
0.0013 | 29 | 9.6% |
0.0012 | 21 | 6.9% |
0.0006 | 17 | 5.6% |
0.0009 | 17 | 5.6% |
0.0017 | 15 | 5.0% |
0.0011 | 12 | 4.0% |
0.001 | 9 | 3.0% |
0.0007 | 6 | 2.0% |
Other values (11) | 25 | 8.3% |
호선 | 시 설 명 (역사명) | 측정 지점 | 측 정 항 목.2 | 측 정 항 목.3 | 측 정 항 목.4 | |
---|---|---|---|---|---|---|
호선 | 1.000 | 0.000 | 0.000 | 0.752 | 0.527 | 0.414 |
시 설 명\n(역사명) | 0.000 | 1.000 | NaN | 0.000 | 0.979 | 0.727 |
측정\n지점 | 0.000 | NaN | 1.000 | 0.786 | 0.744 | 0.918 |
측 정 항 목.2 | 0.752 | 0.000 | 0.786 | 1.000 | 0.805 | 0.857 |
측 정 항 목.3 | 0.527 | 0.979 | 0.744 | 0.805 | 1.000 | 0.786 |
측 정 항 목.4 | 0.414 | 0.727 | 0.918 | 0.857 | 0.786 | 1.000 |
측정 지점 | 호선 | 측 정 항 목.2 | 측 정 항 목.3 | 측 정 항 목.4 | |
---|---|---|---|---|---|
측정\n지점 | 1.000 | 0.000 | 0.472 | 0.487 | 0.639 |
호선 | 0.000 | 1.000 | 0.454 | 0.313 | 0.232 |
측 정 항 목.2 | 0.472 | 0.454 | 1.000 | 0.319 | 0.367 |
측 정 항 목.3 | 0.487 | 0.313 | 0.319 | 1.000 | 0.352 |
측 정 항 목.4 | 0.639 | 0.232 | 0.367 | 0.352 | 1.000 |
호선 | 측정 지점 | 측 정 항 목.2 | 측 정 항 목.3 | 측 정 항 목.4 | |
---|---|---|---|---|---|
호선 | 1.000 | 0.000 | 0.454 | 0.313 | 0.232 |
측정\n지점 | 0.000 | 1.000 | 0.472 | 0.487 | 0.639 |
측 정 항 목.2 | 0.454 | 0.472 | 1.000 | 0.319 | 0.367 |
측 정 항 목.3 | 0.313 | 0.487 | 0.319 | 1.000 | 0.352 |
측 정 항 목.4 | 0.232 | 0.639 | 0.367 | 0.352 | 1.000 |
호선 | 시 설 명 (역사명) | 측정 지점 | 측 정 항 목 | 측 정 항 목.1 | 측 정 항 목.2 | 측 정 항 목.3 | 측 정 항 목.4 | |
---|---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | PM10 | CO2 | HCHO | CO | 석면 |
1 | <NA> | <NA> | 공기질 기준 | 150㎍/㎥이하 | 1,000ppm이하 | 100㎍/㎥이하 | 10ppm이하 | 0.01개/cc이하 |
2 | 1 | 서울역 | 평 균 | 91.3 | 522.5 | 19.2 | 0.8 | 0.0007 |
3 | 1 | <NA> | 승강장 | 105.5 | 579 | 12.7 | 0.7 | 0.0009 |
4 | 1 | <NA> | 대합실 | 77 | 466 | 25.6 | 0.8 | 0.0004 |
5 | 1 | 시 청 | 평 균 | 92.9 | 578 | 19.5 | 0.9 | 0.0011 |
6 | 1 | <NA> | 승강장 | 108.8 | 591 | 13 | 0.6 | 0.0013 |
7 | 1 | <NA> | 대합실 | 76.9 | 565 | 26 | 1.2 | 0.0008 |
8 | 1 | 종 각 | 평 균 | 109.8 | 500 | 12.8 | 0.7 | 0.0015 |
9 | 1 | <NA> | 승강장 | 123.2 | 516 | 12.8 | 0.6 | 0.0021 |
호선 | 시 설 명 (역사명) | 측정 지점 | 측 정 항 목 | 측 정 항 목.1 | 측 정 항 목.2 | 측 정 항 목.3 | 측 정 항 목.4 | |
---|---|---|---|---|---|---|---|---|
293 | 4 | 총신대 입구 | 평 균 | 83.9 | 541.5 | 13.2 | 1.1 | 0.0006 |
294 | 4 | <NA> | 승강장 | 98.4 | 536 | 13.2 | 1.1 | 0.0008 |
295 | 4 | <NA> | 대합실 | 69.3 | 547 | 13.2 | 1 | 0.0004 |
296 | 4 | 사 당 | 평 균 | 88.4 | 502.7 | 17.2 | 0.4 | 0.0009 |
297 | 4 | <NA> | 승강장 | 116.4 | 516 | 12.9 | 0.3 | 0.0014 |
298 | 4 | <NA> | 대합실 | 72.8 | 431 | 25.8 | 0.4 | 0.0008 |
299 | 4 | <NA> | 환승통로 | 76 | 561 | 12.9 | 0.5 | 0.0006 |
300 | 4 | 남태령 | 평 균 | 107.7 | 397 | 19.6 | 1 | 0.0006 |
301 | 4 | <NA> | 승강장 | 122.8 | 421 | 26.1 | 1 | 0.0008 |
302 | 4 | <NA> | 대합실 | 92.6 | 373 | 13 | 0.9 | 0.0004 |