Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 57 |
Missing cells | 27 |
Missing cells (%) | 6.8% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 3.2 KiB |
Average record size in memory | 58.3 B |
Variable types
Categorical | 4 |
---|---|
Text | 2 |
DateTime | 1 |
Dataset
Description | 주요 원전공급국가의 해외 원전건설 현황에 대한 데이터로, 공급국가명, 대상국가명, 원전명, 체결시점, 진행상태 등의 항목을 포함하여 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15100959/fileData.do |
공급국가명 is highly overall correlated with 노형 | High correlation |
대상국가명 is highly overall correlated with 노형 and 1 other fields | High correlation |
노형 is highly overall correlated with 공급국가명 and 1 other fields | High correlation |
진행상태 is highly overall correlated with 대상국가명 | High correlation |
체결시점 has 27 (47.4%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 13:16:30.909009 |
---|---|
Analysis finished | 2023-12-12 13:16:31.514230 |
Duration | 0.61 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
공급국가명
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 10.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 588.0 B |
러시아 | |
---|---|
미국 | |
중국 | |
프랑스 | |
러시아 | 2 |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 2.6666667 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 러시아 |
---|---|
2nd row | 러시아 |
3rd row | 러시아 |
4th row | 러시아 |
5th row | 러시아 |
Common Values
Value | Count | Frequency (%) |
러시아 | 29 | |
미국 | 12 | |
중국 | 7 | 12.3% |
프랑스 | 5 | 8.8% |
러시아 | 2 | 3.5% |
일본 | 2 | 3.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
러시아 | 31 | |
미국 | 12 | 21.1% |
중국 | 7 | 12.3% |
프랑스 | 5 | 8.8% |
일본 | 2 | 3.5% |
대상국가명
Categorical
HIGH CORRELATION
 
Distinct | 22 |
---|---|
Distinct (%) | 38.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 588.0 B |
중국 | |
---|---|
인도 | |
튀르키예 | |
이집트 | |
영국 | |
Other values (17) |
Length
Max length | 8 |
---|---|
Median length | 6 |
Mean length | 3.122807 |
Min length | 2 |
Unique
Unique | 10 ? |
---|---|
Unique (%) | 17.5% |
Sample
1st row | 벨라루스 |
---|---|
2nd row | 인도 |
3rd row | 인도 |
4th row | 인도 |
5th row | 인도 |
Common Values
Value | Count | Frequency (%) |
중국 | 12 | |
인도 | 7 | |
튀르키예 | 6 | |
이집트 | 4 | 7.0% |
영국 | 4 | 7.0% |
핀란드 | 2 | 3.5% |
베트남 | 2 | 3.5% |
헝거리 | 2 | 3.5% |
파키스탄 | 2 | 3.5% |
방글라데시 | 2 | 3.5% |
Other values (12) | 14 |
Length
Value | Count | Frequency (%) |
중국 | 12 | |
인도 | 7 | |
튀르키예 | 6 | |
이집트 | 4 | 7.0% |
영국 | 4 | 7.0% |
파키스탄 | 2 | 3.5% |
이란 | 2 | 3.5% |
방글라데시 | 2 | 3.5% |
루마니아 | 2 | 3.5% |
헝거리 | 2 | 3.5% |
Other values (12) | 14 |
원전명
Text
Distinct | 56 |
---|---|
Distinct (%) | 98.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 588.0 B |
Length
Max length | 19 |
---|---|
Median length | 15 |
Mean length | 11.403509 |
Min length | 2 |
Characters and Unicode
Total characters | 650 |
---|---|
Distinct characters | 59 |
Distinct categories | 7 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 55 ? |
---|---|
Unique (%) | 96.5% |
Sample
1st row | Ostrovets 2호기 |
---|---|
2nd row | Kudankulam 3호기 |
3rd row | Kudankulam 4호기 |
4th row | Kudankulam 5호기 |
5th row | Kudankulam 6호기 |
Value | Count | Frequency (%) |
3호기 | 11 | 9.3% |
2호기 | 9 | 7.6% |
1호기 | 8 | 6.8% |
4호기 | 6 | 5.1% |
dabaa | 4 | 3.4% |
kudankulam | 4 | 3.4% |
tianwan | 4 | 3.4% |
el | 4 | 3.4% |
akkuyu | 4 | 3.4% |
ninh | 2 | 1.7% |
Other values (47) | 62 |
Most occurring characters
Value | Count | Frequency (%) |
a | 78 | 12.0% |
62 | 9.5% | |
기 | 46 | 7.1% |
호 | 40 | 6.2% |
n | 38 | 5.8% |
u | 29 | 4.5% |
i | 27 | 4.2% |
k | 19 | 2.9% |
h | 18 | 2.8% |
l | 18 | 2.8% |
Other values (49) | 275 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 370 | |
Other Letter | 90 | 13.8% |
Uppercase Letter | 72 | 11.1% |
Space Separator | 62 | 9.5% |
Decimal Number | 53 | 8.2% |
Other Punctuation | 2 | 0.3% |
Dash Punctuation | 1 | 0.2% |
Most frequent character per category
Lowercase Letter
Value | Count | Frequency (%) |
a | 78 | |
n | 38 | |
u | 29 | 7.8% |
i | 27 | 7.3% |
k | 19 | 5.1% |
h | 18 | 4.9% |
l | 18 | 4.9% |
o | 18 | 4.9% |
e | 18 | 4.9% |
d | 15 | 4.1% |
Other values (13) | 92 |
Uppercase Letter
Value | Count | Frequency (%) |
T | 9 | |
K | 7 | 9.7% |
C | 7 | 9.7% |
B | 6 | 8.3% |
A | 5 | 6.9% |
S | 4 | 5.6% |
D | 4 | 5.6% |
E | 4 | 5.6% |
H | 4 | 5.6% |
V | 3 | 4.2% |
Other values (9) | 19 |
Decimal Number
Value | Count | Frequency (%) |
2 | 13 | |
3 | 13 | |
1 | 11 | |
4 | 8 | |
6 | 3 | 5.7% |
8 | 2 | 3.8% |
5 | 2 | 3.8% |
7 | 1 | 1.9% |
Other Letter
Value | Count | Frequency (%) |
기 | 46 | |
호 | 40 | |
신 | 1 | 1.1% |
규 | 1 | 1.1% |
원 | 1 | 1.1% |
전 | 1 | 1.1% |
Space Separator
Value | Count | Frequency (%) |
62 |
Other Punctuation
Value | Count | Frequency (%) |
, | 2 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 442 | |
Common | 118 | 18.2% |
Hangul | 90 | 13.8% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
a | 78 | |
n | 38 | 8.6% |
u | 29 | 6.6% |
i | 27 | 6.1% |
k | 19 | 4.3% |
h | 18 | 4.1% |
l | 18 | 4.1% |
o | 18 | 4.1% |
e | 18 | 4.1% |
d | 15 | 3.4% |
Other values (32) | 164 |
Common
Value | Count | Frequency (%) |
62 | ||
2 | 13 | 11.0% |
3 | 13 | 11.0% |
1 | 11 | 9.3% |
4 | 8 | 6.8% |
6 | 3 | 2.5% |
, | 2 | 1.7% |
8 | 2 | 1.7% |
5 | 2 | 1.7% |
7 | 1 | 0.8% |
Hangul
Value | Count | Frequency (%) |
기 | 46 | |
호 | 40 | |
신 | 1 | 1.1% |
규 | 1 | 1.1% |
원 | 1 | 1.1% |
전 | 1 | 1.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 560 | |
Hangul | 90 | 13.8% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
a | 78 | 13.9% |
62 | 11.1% | |
n | 38 | 6.8% |
u | 29 | 5.2% |
i | 27 | 4.8% |
k | 19 | 3.4% |
h | 18 | 3.2% |
l | 18 | 3.2% |
o | 18 | 3.2% |
e | 18 | 3.2% |
Other values (43) | 235 |
Hangul
Value | Count | Frequency (%) |
기 | 46 | |
호 | 40 | |
신 | 1 | 1.1% |
규 | 1 | 1.1% |
원 | 1 | 1.1% |
전 | 1 | 1.1% |
노형
Categorical
HIGH CORRELATION
 
Distinct | 13 |
---|---|
Distinct (%) | 22.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 588.0 B |
VVER-1200 | |
---|---|
AP1000 | |
VVER-1100 | |
EPR1600 | |
Hualong1 | |
Other values (8) |
Length
Max length | 10 |
---|---|
Median length | 9 |
Mean length | 7.6842105 |
Min length | 3 |
Unique
Unique | 6 ? |
---|---|
Unique (%) | 10.5% |
Sample
1st row | VVER-1200 |
---|---|
2nd row | VVER V-491 |
3rd row | VVER-1100 |
4th row | VVER-1100 |
5th row | VVER-1100 |
Common Values
Value | Count | Frequency (%) |
VVER-1200 | 23 | |
AP1000 | 9 | 15.8% |
VVER-1100 | 6 | 10.5% |
EPR1600 | 5 | 8.8% |
Hualong1 | 4 | 7.0% |
ABWR | 2 | 3.5% |
Candu6 | 2 | 3.5% |
VVER V-491 | 1 | 1.8% |
VVER | 1 | 1.8% |
ATMEA1 | 1 | 1.8% |
Other values (3) | 3 | 5.3% |
Length
Value | Count | Frequency (%) |
vver-1200 | 23 | |
ap1000 | 9 | 15.5% |
vver-1100 | 6 | 10.3% |
epr1600 | 5 | 8.6% |
hualong1 | 4 | 6.9% |
abwr | 2 | 3.4% |
candu6 | 2 | 3.4% |
vver | 2 | 3.4% |
v-491 | 1 | 1.7% |
atmea1 | 1 | 1.7% |
Other values (3) | 3 | 5.2% |
체결시점
Date
MISSING
 
Distinct | 16 |
---|---|
Distinct (%) | 53.3% |
Missing | 27 |
Missing (%) | 47.4% |
Memory size | 588.0 B |
Minimum | 1976-02-01 00:00:00 |
---|---|
Maximum | 2022-10-28 00:00:00 |
진행상태
Categorical
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 12.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 588.0 B |
건설중 | |
---|---|
건설착수전 | |
건설완료 | |
사업중단 | |
계획중단 | |
Other values (2) |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 3.8947368 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.8% |
Sample
1st row | 건설중 |
---|---|
2nd row | 건설중 |
3rd row | 건설중 |
4th row | 건설중 |
5th row | 건설중 |
Common Values
Value | Count | Frequency (%) |
건설중 | 19 | |
건설착수전 | 13 | |
건설완료 | 11 | |
사업중단 | 8 | |
계획중단 | 3 | 5.3% |
협상중단 | 2 | 3.5% |
건설취소 | 1 | 1.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
건설중 | 19 | |
건설착수전 | 13 | |
건설완료 | 11 | |
사업중단 | 8 | |
계획중단 | 3 | 5.3% |
협상중단 | 2 | 3.5% |
건설취소 | 1 | 1.8% |
세부현황
Text
Distinct | 41 |
---|---|
Distinct (%) | 71.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 588.0 B |
Length
Max length | 71 |
---|---|
Median length | 53 |
Mean length | 19.666667 |
Min length | 6 |
Characters and Unicode
Total characters | 1121 |
---|---|
Distinct characters | 167 |
Distinct categories | 8 ? |
Distinct scripts | 4 ? |
Distinct blocks | 3 ? |
Unique
Unique | 31 ? |
---|---|
Unique (%) | 54.4% |
Sample
1st row | 2023년내 상업운전 예상 |
---|---|
2nd row | 2026년 상업운전 예정 |
3rd row | 2027년 상업운전 예정 |
4th row | 2021년 6월 건설 시작 |
5th row | 2021년 12월 건설 시작 |
Value | Count | Frequency (%) |
상업운전 | 28 | 11.5% |
예정 | 13 | 5.3% |
2018년 | 7 | 2.9% |
목표 | 6 | 2.5% |
2027년 | 5 | 2.0% |
건설계획 | 5 | 2.0% |
2021년 | 4 | 1.6% |
2022년 | 4 | 1.6% |
가동목표 | 4 | 1.6% |
2028년 | 4 | 1.6% |
Other values (119) | 164 |
Most occurring characters
Value | Count | Frequency (%) |
187 | 16.7% | |
2 | 102 | 9.1% |
0 | 58 | 5.2% |
년 | 55 | 4.9% |
전 | 44 | 3.9% |
업 | 38 | 3.4% |
운 | 31 | 2.8% |
상 | 29 | 2.6% |
1 | 25 | 2.2% |
정 | 19 | 1.7% |
Other values (157) | 533 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 654 | |
Decimal Number | 244 | 21.8% |
Space Separator | 187 | 16.7% |
Other Punctuation | 16 | 1.4% |
Uppercase Letter | 9 | 0.8% |
Close Punctuation | 4 | 0.4% |
Open Punctuation | 4 | 0.4% |
Math Symbol | 3 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
년 | 55 | 8.4% |
전 | 44 | 6.7% |
업 | 38 | 5.8% |
운 | 31 | 4.7% |
상 | 29 | 4.4% |
정 | 19 | 2.9% |
설 | 18 | 2.8% |
건 | 17 | 2.6% |
예 | 15 | 2.3% |
사 | 14 | 2.1% |
Other values (136) | 374 |
Decimal Number
Value | Count | Frequency (%) |
2 | 102 | |
0 | 58 | |
1 | 25 | 10.2% |
8 | 15 | 6.1% |
3 | 12 | 4.9% |
7 | 9 | 3.7% |
6 | 9 | 3.7% |
4 | 6 | 2.5% |
9 | 5 | 2.0% |
5 | 3 | 1.2% |
Uppercase Letter
Value | Count | Frequency (%) |
C | 3 | |
W | 2 | |
E | 2 | |
N | 1 | 11.1% |
G | 1 | 11.1% |
Other Punctuation
Value | Count | Frequency (%) |
, | 14 | |
% | 2 | 12.5% |
Space Separator
Value | Count | Frequency (%) |
187 |
Close Punctuation
Value | Count | Frequency (%) |
) | 4 |
Open Punctuation
Value | Count | Frequency (%) |
( | 4 |
Math Symbol
Value | Count | Frequency (%) |
~ | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 652 | |
Common | 458 | |
Latin | 9 | 0.8% |
Han | 2 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
년 | 55 | 8.4% |
전 | 44 | 6.7% |
업 | 38 | 5.8% |
운 | 31 | 4.8% |
상 | 29 | 4.4% |
정 | 19 | 2.9% |
설 | 18 | 2.8% |
건 | 17 | 2.6% |
예 | 15 | 2.3% |
사 | 14 | 2.1% |
Other values (135) | 372 |
Common
Value | Count | Frequency (%) |
187 | ||
2 | 102 | |
0 | 58 | 12.7% |
1 | 25 | 5.5% |
8 | 15 | 3.3% |
, | 14 | 3.1% |
3 | 12 | 2.6% |
7 | 9 | 2.0% |
6 | 9 | 2.0% |
4 | 6 | 1.3% |
Other values (6) | 21 | 4.6% |
Latin
Value | Count | Frequency (%) |
C | 3 | |
W | 2 | |
E | 2 | |
N | 1 | 11.1% |
G | 1 | 11.1% |
Han
Value | Count | Frequency (%) |
社 | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 652 | |
ASCII | 467 | |
CJK | 2 | 0.2% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
187 | ||
2 | 102 | |
0 | 58 | 12.4% |
1 | 25 | 5.4% |
8 | 15 | 3.2% |
, | 14 | 3.0% |
3 | 12 | 2.6% |
7 | 9 | 1.9% |
6 | 9 | 1.9% |
4 | 6 | 1.3% |
Other values (11) | 30 | 6.4% |
Hangul
Value | Count | Frequency (%) |
년 | 55 | 8.4% |
전 | 44 | 6.7% |
업 | 38 | 5.8% |
운 | 31 | 4.8% |
상 | 29 | 4.4% |
정 | 19 | 2.9% |
설 | 18 | 2.8% |
건 | 17 | 2.6% |
예 | 15 | 2.3% |
사 | 14 | 2.1% |
Other values (135) | 372 |
CJK
Value | Count | Frequency (%) |
社 | 2 |
공급국가명 | 대상국가명 | 원전명 | 노형 | 체결시점 | 진행상태 | 세부현황 | |
---|---|---|---|---|---|---|---|
공급국가명 | 1.000 | 0.698 | 0.871 | 0.965 | 0.930 | 0.582 | 0.878 |
대상국가명 | 0.698 | 1.000 | 0.995 | 0.916 | 0.980 | 0.874 | 0.993 |
원전명 | 0.871 | 0.995 | 1.000 | 0.000 | 1.000 | 0.395 | 0.988 |
노형 | 0.965 | 0.916 | 0.000 | 1.000 | 0.955 | 0.784 | 0.944 |
체결시점 | 0.930 | 0.980 | 1.000 | 0.955 | 1.000 | 0.794 | 0.948 |
진행상태 | 0.582 | 0.874 | 0.395 | 0.784 | 0.794 | 1.000 | 0.996 |
세부현황 | 0.878 | 0.993 | 0.988 | 0.944 | 0.948 | 0.996 | 1.000 |
대상국가명 | 진행상태 | 노형 | 공급국가명 | |
---|---|---|---|---|
대상국가명 | 1.000 | 0.512 | 0.547 | 0.331 |
진행상태 | 0.512 | 1.000 | 0.480 | 0.389 |
노형 | 0.547 | 0.480 | 1.000 | 0.829 |
공급국가명 | 0.331 | 0.389 | 0.829 | 1.000 |
공급국가명 | 대상국가명 | 노형 | 진행상태 | |
---|---|---|---|---|
공급국가명 | 1.000 | 0.331 | 0.829 | 0.389 |
대상국가명 | 0.331 | 1.000 | 0.547 | 0.512 |
노형 | 0.829 | 0.547 | 1.000 | 0.480 |
진행상태 | 0.389 | 0.512 | 0.480 | 1.000 |
공급국가명 | 대상국가명 | 원전명 | 노형 | 체결시점 | 진행상태 | 세부현황 | |
---|---|---|---|---|---|---|---|
0 | 러시아 | 벨라루스 | Ostrovets 2호기 | VVER-1200 | 2012-07-01 | 건설중 | 2023년내 상업운전 예상 |
1 | 러시아 | 인도 | Kudankulam 3호기 | VVER V-491 | 2016-02-01 | 건설중 | 2026년 상업운전 예정 |
2 | 러시아 | 인도 | Kudankulam 4호기 | VVER-1100 | 2016-02-01 | 건설중 | 2027년 상업운전 예정 |
3 | 러시아 | 인도 | Kudankulam 5호기 | VVER-1100 | 2017-06-01 | 건설중 | 2021년 6월 건설 시작 |
4 | 러시아 | 인도 | Kudankulam 6호기 | VVER-1100 | 2017-06-01 | 건설중 | 2021년 12월 건설 시작 |
5 | 러시아 | 이란 | Bushehr 2호기 | VVER-1100 | 2014-11-01 | 건설중 | 2024년 상업운전 예정 |
6 | 러시아 | 이란 | Bushehr 3호기 | VVER-1100 | 2014-11-01 | 건설착수전 | 2021년 부지작업 착수 |
7 | 러시아 | 방글라데시 | Rooppur 1호기 | VVER-1200 | 2011-02-01 | 건설중 | 2024년 하반기 상업운전 예정 |
8 | 러시아 | 방글라데시 | Rooppur 2호기 | VVER-1200 | 2011-02-01 | 건설중 | 2024년~2025년 상업운전 예정 |
9 | 러시아 | 튀르키예 | Akkuyu 1호기 | VVER-1200 | 2010-05-01 | 건설중 | 2024년 상업운전 예정 |
공급국가명 | 대상국가명 | 원전명 | 노형 | 체결시점 | 진행상태 | 세부현황 | |
---|---|---|---|---|---|---|---|
47 | 미국 | 중국 | Haiyang 1호기 | AP1000 | <NA> | 건설완료 | 2018년 상업운전 |
48 | 미국 | 중국 | Haiyang 2호기 | AP1000 | <NA> | 건설완료 | 2019년 상업운전 |
49 | 미국 | 인도 | Kovvada 6기 | AP1000 | <NA> | 계획중단 | 2017년 WEC社의 파산으로 무기한 연기, 2023년 웨스팅하우스와 인도정부 원전도입 재논의중 |
50 | 미국 | 인도 | Chhaya-Mithi Virdi | AP1000 | <NA> | 계획중단 | 2017년 WEC社의 파산으로 무기한 연기, 재개 가능성 있음 |
51 | 미국 | 인도 | Igneada | AP1000 | <NA> | 계획중단 | 추후계획논의 |
52 | 미국 | 영국 | Wylfa Newydd | AP1000 | <NA> | 사업중단 | 2019년 민간투자자 유치의 어려움을 사유로 사업중단 하였으나, 재개 가능성 있음(웨스팅하우스와 영국정부 원전건설 계속 논의중) |
53 | 미국 | 리투아니아 | Visaginas | ABWR | 2011-05-01 | 사업중단 | 2016년 국민반대(원전반대 62%)로 신규원전 건설계획 취소됨에 따라 사업중단 |
54 | 미국 | 필리핀 | Bataan | WEC621 | 1976-02-01 | 사업중단 | 1984년 고온기능 시험 완료후, 체르노빌 사고 및 일부 안전성 논란으로 운영 불허, 2022년 12월 건설재개 검토중 |
55 | 미국 | 대만 | Lungmen 1호기 | BWR | <NA> | 사업중단 | 2014년 가동전 안전검사 완료, 시운전 직전 국민반대로 건설 및 운영 중단 |
56 | 미국 | 폴란드 | 3기 | AP1000 | 2022-10-28 | 건설착수전 | 사전설계 계약, 2033년 가동목표 |