Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 596 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 8 |
Duplicate rows (%) | 1.3% |
Total size in memory | 24.6 KiB |
Average record size in memory | 42.2 B |
Variable types
Categorical | 1 |
---|---|
Numeric | 2 |
Text | 2 |
Dataset
Description | 대한석탄공사 창립 이후 50년 동안 발생한 주요하고 다양한 사건들의 화보 목록을 데이터로 제공합니다. 추후 화보 추가 제공할 예정입니다. |
---|---|
Author | 대한석탄공사 |
URL | https://www.data.go.kr/data/15100227/fileData.do |
Dataset has 8 (1.3%) duplicate rows | Duplicates |
권 is highly overall correlated with 구분 | High correlation |
구분 is highly overall correlated with 권 | High correlation |
번호 has 24 (4.0%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 03:35:03.740185 |
---|---|
Analysis finished | 2023-12-12 03:35:04.785042 |
Duration | 1.04 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
구분
Categorical
HIGH CORRELATION
 
Distinct | 46 |
---|---|
Distinct (%) | 7.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.8 KiB |
1990~2001 | |
---|---|
1980~1989 | |
1960~1969 | |
1970~1979 | |
1950~1959 | |
Other values (41) |
Length
Max length | 11 |
---|---|
Median length | 10 |
Mean length | 6.8389262 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 창립이전 |
4th row | 창립이전 |
5th row | 창립이전 |
Common Values
Value | Count | Frequency (%) |
1990~2001 | 71 | 11.9% |
1980~1989 | 55 | 9.2% |
1960~1969 | 53 | 8.9% |
1970~1979 | 53 | 8.9% |
1950~1959 | 50 | 8.4% |
창립이전 | 16 | 2.7% |
부산.묵호사업소 | 15 | 2.5% |
화순광업소 | 13 | 2.2% |
사택2 | 12 | 2.0% |
도계광업소 | 12 | 2.0% |
Other values (36) | 246 |
Length
Value | Count | Frequency (%) |
1990~2001 | 71 | 11.5% |
1980~1989 | 55 | 8.9% |
1960~1969 | 53 | 8.6% |
1970~1979 | 53 | 8.6% |
1950~1959 | 50 | 8.1% |
창립이전 | 16 | 2.6% |
부산.묵호사업소 | 15 | 2.4% |
화순광업소 | 13 | 2.1% |
행사 | 13 | 2.1% |
사택2 | 12 | 1.9% |
Other values (38) | 265 |
권
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.2080537 |
Minimum | 0 |
---|---|
Maximum | 5 |
Zeros | 1 |
Zeros (%) | 0.2% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 5.4 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 1 |
Q1 | 2 |
median | 3 |
Q3 | 4 |
95-th percentile | 5 |
Maximum | 5 |
Range | 5 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 1.2530308 |
---|---|
Coefficient of variation (CV) | 0.39058911 |
Kurtosis | -0.92009727 |
Mean | 3.2080537 |
Median Absolute Deviation (MAD) | 1 |
Skewness | -0.084394806 |
Sum | 1912 |
Variance | 1.5700863 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
3 | 187 | |
5 | 123 | |
2 | 115 | |
4 | 112 | |
1 | 58 | 9.7% |
0 | 1 | 0.2% |
Value | Count | Frequency (%) |
0 | 1 | 0.2% |
1 | 58 | 9.7% |
2 | 115 | |
3 | 187 | |
4 | 112 | |
5 | 123 |
Value | Count | Frequency (%) |
5 | 123 | |
4 | 112 | |
3 | 187 | |
2 | 115 | |
1 | 58 | 9.7% |
0 | 1 | 0.2% |
페이지
Text
Distinct | 179 |
---|---|
Distinct (%) | 30.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.8 KiB |
Value | Count | Frequency (%) |
19 | 8 | 1.3% |
130 | 7 | 1.2% |
190 | 6 | 1.0% |
169 | 5 | 0.8% |
163 | 5 | 0.8% |
155 | 5 | 0.8% |
161 | 5 | 0.8% |
117 | 5 | 0.8% |
89 | 5 | 0.8% |
197 | 5 | 0.8% |
Other values (169) | 540 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 471 | |
8 | 137 | 8.9% |
9 | 130 | 8.4% |
7 | 125 | 8.1% |
6 | 123 | 8.0% |
3 | 113 | 7.3% |
4 | 113 | 7.3% |
5 | 111 | 7.2% |
2 | 108 | 7.0% |
0 | 106 | 6.9% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 1537 | |
Other Letter | 2 | 0.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 471 | |
8 | 137 | 8.9% |
9 | 130 | 8.5% |
7 | 125 | 8.1% |
6 | 123 | 8.0% |
3 | 113 | 7.4% |
4 | 113 | 7.4% |
5 | 111 | 7.2% |
2 | 108 | 7.0% |
0 | 106 | 6.9% |
Other Letter
Value | Count | Frequency (%) |
권 | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 1537 | |
Hangul | 2 | 0.1% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 471 | |
8 | 137 | 8.9% |
9 | 130 | 8.5% |
7 | 125 | 8.1% |
6 | 123 | 8.0% |
3 | 113 | 7.4% |
4 | 113 | 7.4% |
5 | 111 | 7.2% |
2 | 108 | 7.0% |
0 | 106 | 6.9% |
Hangul
Value | Count | Frequency (%) |
권 | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 1537 | |
Hangul | 2 | 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 471 | |
8 | 137 | 8.9% |
9 | 130 | 8.5% |
7 | 125 | 8.1% |
6 | 123 | 8.0% |
3 | 113 | 7.4% |
4 | 113 | 7.4% |
5 | 111 | 7.2% |
2 | 108 | 7.0% |
0 | 106 | 6.9% |
Hangul
Value | Count | Frequency (%) |
권 | 2 |
번호
Real number (ℝ)
ZEROS
 
Distinct | 11 |
---|---|
Distinct (%) | 1.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.7600671 |
Minimum | 0 |
---|---|
Maximum | 10 |
Zeros | 24 |
Zeros (%) | 4.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 5.4 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 1 |
Q1 | 2 |
median | 4 |
Q3 | 5 |
95-th percentile | 8 |
Maximum | 10 |
Range | 10 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 2.2524271 |
---|---|
Coefficient of variation (CV) | 0.59903907 |
Kurtosis | -0.65173093 |
Mean | 3.7600671 |
Median Absolute Deviation (MAD) | 2 |
Skewness | 0.35564953 |
Sum | 2241 |
Variance | 5.0734279 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2 | 90 | |
1 | 89 | |
3 | 88 | |
4 | 86 | |
5 | 80 | |
6 | 60 | |
7 | 42 | |
8 | 25 | 4.2% |
0 | 24 | 4.0% |
9 | 10 | 1.7% |
Value | Count | Frequency (%) |
0 | 24 | 4.0% |
1 | 89 | |
2 | 90 | |
3 | 88 | |
4 | 86 | |
5 | 80 | |
6 | 60 | |
7 | 42 | |
8 | 25 | 4.2% |
9 | 10 | 1.7% |
Value | Count | Frequency (%) |
10 | 2 | 0.3% |
9 | 10 | 1.7% |
8 | 25 | 4.2% |
7 | 42 | |
6 | 60 | |
5 | 80 | |
4 | 86 | |
3 | 88 | |
2 | 90 | |
1 | 89 |
내용
Text
Distinct | 529 |
---|---|
Distinct (%) | 88.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.8 KiB |
Length
Max length | 119 |
---|---|
Median length | 70 |
Mean length | 44.41443 |
Min length | 1 |
Characters and Unicode
Total characters | 26471 |
---|---|
Distinct characters | 525 |
Distinct categories | 11 ? |
Distinct scripts | 4 ? |
Distinct blocks | 3 ? |
Unique
Unique | 469 ? |
---|---|
Unique (%) | 78.7% |
Sample
1st row | 불1자산 1 |
---|---|
2nd row | 화보 50년간지자산 1 |
3rd row | 1939년의 계산동 지역.(1930~1950_개발초기의 장성) |
4th row | 장성2구 사무소 부근. 장성 동구지역으로 구 양지갱으로 개발됐다.(1930~1950_개발초기의 장성) |
5th row | 금천구역. 2구(왼쪽)부터 1구(오른쪽)까지 수평갱도에 의해 개발했다.(1930~1950_개발초기의 장성) |
Value | Count | Frequency (%) |
장성 | 49 | 1.2% |
위해 | 33 | 0.8% |
사장이 | 29 | 0.7% |
공사는 | 26 | 0.6% |
공사 | 24 | 0.6% |
방문하여 | 21 | 0.5% |
장성을 | 18 | 0.4% |
건설 | 17 | 0.4% |
총재가 | 17 | 0.4% |
창립 | 17 | 0.4% |
Other values (2365) | 3806 |
Most occurring characters
Value | Count | Frequency (%) |
3463 | 13.1% | |
9 | 1336 | 5.0% |
1 | 1241 | 4.7% |
( | 899 | 3.4% |
) | 896 | 3.4% |
. | 765 | 2.9% |
0 | 653 | 2.5% |
사 | 451 | 1.7% |
_ | 425 | 1.6% |
다 | 371 | 1.4% |
Other values (515) | 15971 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 14706 | |
Decimal Number | 4792 | 18.1% |
Space Separator | 3463 | 13.1% |
Open Punctuation | 900 | 3.4% |
Other Punctuation | 898 | 3.4% |
Close Punctuation | 897 | 3.4% |
Connector Punctuation | 425 | 1.6% |
Math Symbol | 308 | 1.2% |
Uppercase Letter | 76 | 0.3% |
Dash Punctuation | 5 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
사 | 451 | 3.1% |
다 | 371 | 2.5% |
장 | 361 | 2.5% |
을 | 309 | 2.1% |
의 | 289 | 2.0% |
에 | 269 | 1.8% |
하 | 267 | 1.8% |
이 | 237 | 1.6% |
소 | 236 | 1.6% |
성 | 227 | 1.5% |
Other values (475) | 11689 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 23 | |
I | 13 | |
D | 9 | 11.8% |
C | 4 | 5.3% |
K | 4 | 5.3% |
T | 4 | 5.3% |
V | 3 | 3.9% |
M | 3 | 3.9% |
P | 3 | 3.9% |
S | 3 | 3.9% |
Other values (5) | 7 | 9.2% |
Decimal Number
Value | Count | Frequency (%) |
9 | 1336 | |
1 | 1241 | |
0 | 653 | |
5 | 298 | 6.2% |
6 | 287 | 6.0% |
7 | 274 | 5.7% |
2 | 253 | 5.3% |
8 | 243 | 5.1% |
4 | 104 | 2.2% |
3 | 103 | 2.1% |
Other Punctuation
Value | Count | Frequency (%) |
. | 765 | |
, | 87 | 9.7% |
' | 32 | 3.6% |
; | 10 | 1.1% |
: | 4 | 0.4% |
Open Punctuation
Value | Count | Frequency (%) |
( | 899 | |
[ | 1 | 0.1% |
Close Punctuation
Value | Count | Frequency (%) |
) | 896 | |
] | 1 | 0.1% |
Math Symbol
Value | Count | Frequency (%) |
~ | 307 | |
+ | 1 | 0.3% |
Space Separator
Value | Count | Frequency (%) |
3463 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 425 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 5 |
Lowercase Letter
Value | Count | Frequency (%) |
m | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 14704 | |
Common | 11688 | |
Latin | 77 | 0.3% |
Han | 2 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
사 | 451 | 3.1% |
다 | 371 | 2.5% |
장 | 361 | 2.5% |
을 | 309 | 2.1% |
의 | 289 | 2.0% |
에 | 269 | 1.8% |
하 | 267 | 1.8% |
이 | 237 | 1.6% |
소 | 236 | 1.6% |
성 | 227 | 1.5% |
Other values (473) | 11687 |
Common
Value | Count | Frequency (%) |
3463 | ||
9 | 1336 | 11.4% |
1 | 1241 | 10.6% |
( | 899 | 7.7% |
) | 896 | 7.7% |
. | 765 | 6.5% |
0 | 653 | 5.6% |
_ | 425 | 3.6% |
~ | 307 | 2.6% |
5 | 298 | 2.5% |
Other values (14) | 1405 |
Latin
Value | Count | Frequency (%) |
A | 23 | |
I | 13 | |
D | 9 | 11.7% |
C | 4 | 5.2% |
K | 4 | 5.2% |
T | 4 | 5.2% |
V | 3 | 3.9% |
M | 3 | 3.9% |
P | 3 | 3.9% |
S | 3 | 3.9% |
Other values (6) | 8 | 10.4% |
Han
Value | Count | Frequency (%) |
質 | 1 | |
軟 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 14704 | |
ASCII | 11765 | |
CJK | 2 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
3463 | ||
9 | 1336 | 11.4% |
1 | 1241 | 10.5% |
( | 899 | 7.6% |
) | 896 | 7.6% |
. | 765 | 6.5% |
0 | 653 | 5.6% |
_ | 425 | 3.6% |
~ | 307 | 2.6% |
5 | 298 | 2.5% |
Other values (30) | 1482 |
Hangul
Value | Count | Frequency (%) |
사 | 451 | 3.1% |
다 | 371 | 2.5% |
장 | 361 | 2.5% |
을 | 309 | 2.1% |
의 | 289 | 2.0% |
에 | 269 | 1.8% |
하 | 267 | 1.8% |
이 | 237 | 1.6% |
소 | 236 | 1.6% |
성 | 227 | 1.5% |
Other values (473) | 11687 |
CJK
Value | Count | Frequency (%) |
質 | 1 | |
軟 | 1 |
구분 | 권 | 번호 | |
---|---|---|---|
구분 | 1.000 | 0.989 | 0.000 |
권 | 0.989 | 1.000 | 0.268 |
번호 | 0.000 | 0.268 | 1.000 |
권 | 번호 | 구분 | |
---|---|---|---|
권 | 1.000 | 0.217 | 0.889 |
번호 | 0.217 | 1.000 | 0.000 |
구분 | 0.889 | 0.000 | 1.000 |
구분 | 권 | 페이지 | 번호 | 내용 | |
---|---|---|---|---|---|
0 | 0 | 0 | 1권 | 0 | 불1자산 1 |
1 | 0 | 1 | 1권 | 0 | 화보 50년간지자산 1 |
2 | 창립이전 | 1 | 10 | 1 | 1939년의 계산동 지역.(1930~1950_개발초기의 장성) |
3 | 창립이전 | 1 | 10 | 2 | 장성2구 사무소 부근. 장성 동구지역으로 구 양지갱으로 개발됐다.(1930~1950_개발초기의 장성) |
4 | 창립이전 | 1 | 10 | 3 | 금천구역. 2구(왼쪽)부터 1구(오른쪽)까지 수평갱도에 의해 개발했다.(1930~1950_개발초기의 장성) |
5 | 창립이전 | 1 | 11 | 4 | 1939년의 화광도과 협심동 지역.(1930~1950_개발초기의 장성) |
6 | 창립이전 | 1 | 12 | 1 | 장성 갱구(1940).퇴갱한 직원들이 축전 차에 올라 기념촬영을 했다.(1930~1950_삼척탄광 개광) |
7 | 창립이전 | 1 | 12 | 2 | 개발 초기의 장성 갱구(1936.12. 기계 측량을 마친 직원들이 기념촬영했다.(1930~1950_삼척탄광 개광) |
8 | 창립이전 | 1 | 13 | 3 | 준공 직후의 장성 이중교(1939)(1930~1950_삼척탄광 개광) |
9 | 창립이전 | 1 | 13 | 4 | 삼척탄광 본관(1939.8). 1937년 도계에서 장성으로 이전됐다.(1930~1950_삼척탄광 개광) |
구분 | 권 | 페이지 | 번호 | 내용 | |
---|---|---|---|---|---|
586 | 노동조합 | 5 | 195 | 4 | 1962년 정기대의원대회 광경(_노동조합) |
587 | 노동조합 | 5 | 195 | 5 | 1962년 정기대의원대회 광경(_노동조합) |
588 | 노사화합 행사 | 5 | 196 | 1 | 노사화합 체육대회 광경(_노사화합 행사) |
589 | 노사화합 행사 | 5 | 196 | 2 | 노사화합 체육대회 광경(_노사화합 행사) |
590 | 노사화합 행사 | 5 | 196 | 3 | 노사화합 체육대회 광경(_노사화합 행사) |
591 | 노사화합 행사 | 5 | 197 | 4 | 1965년 도계체육대회 광경(_노사화합 행사) |
592 | 노사화합 행사 | 5 | 197 | 5 | 장성과 도계는 5월, 화순에서는 10월에 거행된다. 체육대회는 가족과 지역주민까지 참여하는 지역의 중요한 행사로 치러졌다.(_노사화합 행사) |
593 | 노사화합 행사 | 5 | 197 | 6 | 장성과 도계는 5월, 화순에서는 10월에 거행된다. 체육대회는 가족과 지역주민까지 참여하는 지역의 중요한 행사로 치러졌다.(_노사화합 행사) |
594 | 노사화합 행사 | 5 | 197 | 7 | 단오절을 기해 안전작업을 기원하는 산신제가 노사합동으로 거행된다.(_노사화합 행사) |
595 | 노사화합 행사 | 5 | 197 | 8 | 노동절과 추석에는 전국 요양기관에서 입원치료를 받고 있는 공상환자를 함께 위문한다. (_노사화합 행사) |
Most frequently occurring
구분 | 권 | 페이지 | 번호 | 내용 | # duplicates | |
---|---|---|---|---|---|---|
0 | 1950~1959 | 1 | 19 | 0 | 설립준비위원회가 작성한 최초의 정관(1950.6.7)(1950~1959_창립) | 4 |
1 | 1950~1959 | 1 | 19 | 0 | 최초의 정관에 대한 대통령 인가서(1950.6.23)(1950~1959_창립) | 2 |
2 | 1960~1969 | 2 | 37 | 0 | 재건국민운동본부 총재인 유진오 박사가 공사의 재건국민운동촉진회 결성식에서 훈시를 하고 있다. (1961.6.12)(1960~1969) | 2 |
3 | 1960~1969 | 2 | 45 | 0 | 광신보안법 제정 전 공사는 자체적으로 탄광안전규정을 제정하여 시행하였다.(1962.1.1)(1960~1969) | 2 |
4 | 1980~1989 | 3 | 85 | 0 | 웅장한 자태를 드러낸 제2수갱 철탑과 야경 (1980~1989_장성 제2수갱 건설) | 2 |
5 | 1990~2001 | 3 | 106 | 0 | 증권거래소로 이전한 본사 사무실(1998.12.26)(1990~2001) | 2 |
6 | 1990~2001 | 3 | 95 | 0 | 유승규 태백시 국회의원이 국회에서 공사의 자본금 증자를 위한 공사법 개정안에 대해 제안 설명하고 있다. (1990.11)(1990~2001) | 2 |
7 | 창립이전 | 1 | 13 | 0 | 시라키에 의해 1940년 발간된 삼척탄전 조사보고서(1930~1950_삼척탄광 개광) | 2 |