Dataset statistics
Number of variables | 20 |
---|---|
Number of observations | 297 |
Missing cells | 1361 |
Missing cells (%) | 22.9% |
Duplicate rows | 12 |
Duplicate rows (%) | 4.0% |
Total size in memory | 48.6 KiB |
Average record size in memory | 167.4 B |
Variable types
Categorical | 8 |
---|---|
Text | 6 |
Unsupported | 3 |
Numeric | 3 |
Dataset
Description | 대륙명,국가명,도시명,협정구분,분야,체결년도,결연체결일,결연자,결연장소,협정서명,주요내용,협정서,성명(한글),성명(원어),성별,소속,직위,취임일,이임일,교류현황 |
---|---|
Author | 서울특별시 |
URL | https://data.seoul.go.kr/dataList/OA-2486/S/1/datasetView.do |
협정구분 has constant value "" | Constant |
Dataset has 12 (4.0%) duplicate rows | Duplicates |
협정서 has a high cardinality: 51 distinct values | High cardinality |
국가명 is highly overall correlated with 체결년도 and 6 other fields | High correlation |
이임일 is highly overall correlated with 체결년도 and 7 other fields | High correlation |
대륙명 is highly overall correlated with 국가명 and 2 other fields | High correlation |
결연장소 is highly overall correlated with 체결년도 and 6 other fields | High correlation |
협정서 is highly overall correlated with 체결년도 and 5 other fields | High correlation |
성별 is highly overall correlated with 이임일 | High correlation |
결연자 is highly overall correlated with 체결년도 and 5 other fields | High correlation |
체결년도 is highly overall correlated with 결연체결일 and 5 other fields | High correlation |
결연체결일 is highly overall correlated with 체결년도 and 5 other fields | High correlation |
취임일 is highly overall correlated with 결연장소 and 1 other fields | High correlation |
이임일 is highly imbalanced (91.9%) | Imbalance |
분야 has 297 (100.0%) missing values | Missing |
주요내용 has 297 (100.0%) missing values | Missing |
성명(한글) has 59 (19.9%) missing values | Missing |
성명(원어) has 15 (5.1%) missing values | Missing |
소속 has 70 (23.6%) missing values | Missing |
직위 has 56 (18.9%) missing values | Missing |
취임일 has 270 (90.9%) missing values | Missing |
교류현황 has 297 (100.0%) missing values | Missing |
분야 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
주요내용 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
교류현황 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2024-04-21 00:34:18.298712 |
---|---|
Analysis finished | 2024-04-21 00:34:24.521631 |
Duration | 6.22 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
대륙명
Categorical
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 2.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.4 KiB |
아시아 | |
---|---|
유럽 | |
북아메리카 | |
남아메리카 | 11 |
아프리카 | 7 |
Other values (2) | 3 |
Length
Max length | 6 |
---|---|
Median length | 5 |
Mean length | 3.1683502 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | 유럽 |
---|---|
2nd row | 북아메리카 |
3rd row | 유럽 |
4th row | 북아메리카 |
5th row | 유럽 |
Common Values
Value | Count | Frequency (%) |
아시아 | 148 | |
유럽 | 81 | |
북아메리카 | 47 | 15.8% |
남아메리카 | 11 | 3.7% |
아프리카 | 7 | 2.4% |
중앙아메리카 | 2 | 0.7% |
오세아니아 | 1 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
아시아 | 148 | |
유럽 | 81 | |
북아메리카 | 47 | 15.8% |
남아메리카 | 11 | 3.7% |
아프리카 | 7 | 2.4% |
중앙아메리카 | 2 | 0.7% |
오세아니아 | 1 | 0.3% |
국가명
Categorical
HIGH CORRELATION
 
Distinct | 38 |
---|---|
Distinct (%) | 12.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.4 KiB |
중국 | |
---|---|
미국 | |
네팔 | |
우즈베키스탄 | |
스리랑카 | |
Other values (33) |
Length
Max length | 8 |
---|---|
Median length | 2 |
Mean length | 2.8821549 |
Min length | 2 |
Unique
Unique | 8 ? |
---|---|
Unique (%) | 2.7% |
Sample
1st row | 아일랜드 |
---|---|
2nd row | 미국 |
3rd row | 아일랜드 |
4th row | 미국 |
5th row | 스페인 |
Common Values
Value | Count | Frequency (%) |
중국 | 55 | |
미국 | 42 | |
네팔 | 33 | 11.1% |
우즈베키스탄 | 18 | 6.1% |
스리랑카 | 16 | 5.4% |
스페인 | 12 | 4.0% |
헝가리 | 9 | 3.0% |
네덜란드 | 9 | 3.0% |
벨라루스 | 9 | 3.0% |
이란 | 9 | 3.0% |
Other values (28) | 85 |
Length
Value | Count | Frequency (%) |
중국 | 55 | |
미국 | 42 | |
네팔 | 33 | 11.1% |
우즈베키스탄 | 18 | 6.1% |
스리랑카 | 16 | 5.4% |
스페인 | 12 | 4.0% |
헝가리 | 9 | 3.0% |
네덜란드 | 9 | 3.0% |
벨라루스 | 9 | 3.0% |
이란 | 9 | 3.0% |
Other values (28) | 85 |
도시명
Text
Distinct | 54 |
---|---|
Distinct (%) | 18.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.4 KiB |
Value | Count | Frequency (%) |
카투만두 | 33 | 11.1% |
로스엔젤레스 | 24 | 8.1% |
타슈켄트 | 18 | 6.1% |
휴스턴 | 16 | 5.4% |
콜롬보 | 16 | 5.4% |
텐진 | 11 | 3.7% |
바르셀로나 | 10 | 3.4% |
민스크 | 9 | 3.0% |
산둥성 | 9 | 3.0% |
부다페스트 | 9 | 3.0% |
Other values (44) | 142 |
Most occurring characters
Value | Count | Frequency (%) |
스 | 125 | 11.0% |
카 | 45 | 4.0% |
트 | 37 | 3.2% |
성 | 36 | 3.2% |
레 | 35 | 3.1% |
로 | 34 | 3.0% |
투 | 33 | 2.9% |
두 | 33 | 2.9% |
만 | 33 | 2.9% |
엔 | 28 | 2.5% |
Other values (103) | 700 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1139 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
스 | 125 | 11.0% |
카 | 45 | 4.0% |
트 | 37 | 3.2% |
성 | 36 | 3.2% |
레 | 35 | 3.1% |
로 | 34 | 3.0% |
투 | 33 | 2.9% |
두 | 33 | 2.9% |
만 | 33 | 2.9% |
엔 | 28 | 2.5% |
Other values (103) | 700 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1139 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
스 | 125 | 11.0% |
카 | 45 | 4.0% |
트 | 37 | 3.2% |
성 | 36 | 3.2% |
레 | 35 | 3.1% |
로 | 34 | 3.0% |
투 | 33 | 2.9% |
두 | 33 | 2.9% |
만 | 33 | 2.9% |
엔 | 28 | 2.5% |
Other values (103) | 700 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1139 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
스 | 125 | 11.0% |
카 | 45 | 4.0% |
트 | 37 | 3.2% |
성 | 36 | 3.2% |
레 | 35 | 3.1% |
로 | 34 | 3.0% |
투 | 33 | 2.9% |
두 | 33 | 2.9% |
만 | 33 | 2.9% |
엔 | 28 | 2.5% |
Other values (103) | 700 |
협정구분
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.4 KiB |
우호도시 |
---|
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 우호도시 |
---|---|
2nd row | 우호도시 |
3rd row | 우호도시 |
4th row | 우호도시 |
5th row | 우호도시 |
Common Values
Value | Count | Frequency (%) |
우호도시 | 297 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
우호도시 | 297 |
분야
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 297 |
---|---|
Missing (%) | 100.0% |
Memory size | 2.7 KiB |
체결년도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 18 |
---|---|
Distinct (%) | 6.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2011.0572 |
Minimum | 1997 |
---|---|
Maximum | 2023 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.7 KiB |
Quantile statistics
Minimum | 1997 |
---|---|
5-th percentile | 1999 |
Q1 | 2008 |
median | 2012 |
Q3 | 2016 |
95-th percentile | 2018 |
Maximum | 2023 |
Range | 26 |
Interquartile range (IQR) | 8 |
Descriptive statistics
Standard deviation | 5.4772339 |
---|---|
Coefficient of variation (CV) | 0.0027235594 |
Kurtosis | 0.010662885 |
Mean | 2011.0572 |
Median Absolute Deviation (MAD) | 4 |
Skewness | -0.511109 |
Sum | 597284 |
Variance | 30.000091 |
Monotonicity | Decreasing |
Value | Count | Frequency (%) |
2016 | 53 | |
2006 | 34 | |
2014 | 33 | |
2008 | 33 | |
2012 | 21 | 7.1% |
2009 | 19 | 6.4% |
2005 | 17 | 5.7% |
2010 | 16 | 5.4% |
2017 | 15 | 5.1% |
2015 | 13 | 4.4% |
Other values (8) | 43 |
Value | Count | Frequency (%) |
1997 | 9 | 3.0% |
1999 | 9 | 3.0% |
2005 | 17 | |
2006 | 34 | |
2007 | 4 | 1.3% |
2008 | 33 | |
2009 | 19 | |
2010 | 16 | |
2011 | 2 | 0.7% |
2012 | 21 |
Value | Count | Frequency (%) |
2023 | 4 | 1.3% |
2022 | 2 | 0.7% |
2019 | 4 | 1.3% |
2018 | 9 | 3.0% |
2017 | 15 | 5.1% |
2016 | 53 | |
2015 | 13 | 4.4% |
2014 | 33 | |
2012 | 21 | 7.1% |
2011 | 2 | 0.7% |
결연체결일
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 55 |
---|---|
Distinct (%) | 18.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20111334 |
Minimum | 19970110 |
---|---|
Maximum | 20231018 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.7 KiB |
Quantile statistics
Minimum | 19970110 |
---|---|
5-th percentile | 19990315 |
Q1 | 20080708 |
median | 20120625 |
Q3 | 20160608 |
95-th percentile | 20180908 |
Maximum | 20231018 |
Range | 260908 |
Interquartile range (IQR) | 79900 |
Descriptive statistics
Standard deviation | 54897.307 |
---|---|
Coefficient of variation (CV) | 0.0027296701 |
Kurtosis | 0.010603987 |
Mean | 20111334 |
Median Absolute Deviation (MAD) | 39983 |
Skewness | -0.51553055 |
Sum | 5.9730661 × 109 |
Variance | 3.0137143 × 109 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20160926 | 33 | 11.1% |
20060330 | 18 | 6.1% |
20141001 | 16 | 5.4% |
20160608 | 16 | 5.4% |
20061016 | 16 | 5.4% |
20090412 | 11 | 3.7% |
20121113 | 10 | 3.4% |
20171018 | 9 | 3.0% |
20080719 | 9 | 3.0% |
20080708 | 9 | 3.0% |
Other values (45) | 150 |
Value | Count | Frequency (%) |
19970110 | 2 | 0.7% |
19970423 | 7 | 2.4% |
19990315 | 9 | |
20050714 | 9 | |
20050824 | 8 | |
20060330 | 18 | |
20061016 | 16 | |
20070201 | 4 | 1.3% |
20080708 | 9 | |
20080719 | 9 |
Value | Count | Frequency (%) |
20231018 | 1 | |
20230316 | 2 | |
20230216 | 1 | |
20221026 | 1 | |
20220929 | 1 | |
20190712 | 1 | |
20190530 | 1 | |
20190506 | 2 | |
20181005 | 1 | |
20181003 | 1 |
결연자
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.4 KiB |
박원순 | |
---|---|
오세훈 | |
이명박 | |
고건 | 9 |
조순 | 9 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 2.9393939 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 오세훈 |
---|---|
2nd row | 오세훈 |
3rd row | 오세훈 |
4th row | 오세훈 |
5th row | 오세훈 |
Common Values
Value | Count | Frequency (%) |
박원순 | 146 | |
오세훈 | 96 | |
이명박 | 35 | 11.8% |
고건 | 9 | 3.0% |
조순 | 9 | 3.0% |
류경기 | 2 | 0.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
박원순 | 146 | |
오세훈 | 96 | |
이명박 | 35 | 11.8% |
고건 | 9 | 3.0% |
조순 | 9 | 3.0% |
류경기 | 2 | 0.7% |
결연장소
Categorical
HIGH CORRELATION
 
Distinct | 31 |
---|---|
Distinct (%) | 10.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.4 KiB |
서울 | |
---|---|
서울시청 | |
톈진시 | 11 |
바르셀로나 | 10 |
암스테르담 | 9 |
Other values (26) |
Length
Max length | 13 |
---|---|
Median length | 11 |
Mean length | 3.8451178 |
Min length | 2 |
Unique
Unique | 9 ? |
---|---|
Unique (%) | 3.0% |
Sample
1st row | 더블린 맨션하우스 |
---|---|
2nd row | 서울시청 시장 집무실 |
3rd row | 더블린 맨션하우스 |
4th row | 대한민국 서울 |
5th row | 마드리드 시청사 |
Common Values
Value | Count | Frequency (%) |
서울 | 121 | |
서울시청 | 46 | 15.5% |
톈진시 | 11 | 3.7% |
바르셀로나 | 10 | 3.4% |
암스테르담 | 9 | 3.0% |
산둥성 지난시 | 9 | 3.0% |
로스앤젤레스시청 | 8 | 2.7% |
광둥성 광저우시 | 8 | 2.7% |
저장성 항저우시 | 8 | 2.7% |
부에노스아이레스 | 8 | 2.7% |
Other values (21) | 59 |
Length
Value | Count | Frequency (%) |
서울 | 122 | |
서울시청 | 48 | 14.1% |
톈진시 | 11 | 3.2% |
바르셀로나 | 10 | 2.9% |
암스테르담 | 9 | 2.6% |
산둥성 | 9 | 2.6% |
지난시 | 9 | 2.6% |
저장성 | 8 | 2.3% |
부에노스아이레스 | 8 | 2.3% |
항저우시 | 8 | 2.3% |
Other values (30) | 99 |
협정서명
Text
Distinct | 58 |
---|---|
Distinct (%) | 19.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.4 KiB |
Length
Max length | 86 |
---|---|
Median length | 43 |
Mean length | 36.690236 |
Min length | 6 |
Characters and Unicode
Total characters | 10897 |
---|---|
Distinct characters | 198 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 20 ? |
---|---|
Unique (%) | 6.7% |
Sample
1st row | 아일랜드 더블린 시와 대한민국 서울특별시간 우호협정서 |
---|---|
2nd row | 우호 및 협력관계에 관한 양해각서 |
3rd row | 아일랜드 더블린 시와 대한민국 서울특별시간 우호협정서 |
4th row | 대한민국 서울특별시와 미합중국 뉴저지주 간 우호 협력도시 체결을 위한 협약서 |
5th row | 서울특별시(대한민국) 및 마드리드시 (스페인왕국) 간 우호협력 결연에 관한 양해각서 |
Value | Count | Frequency (%) |
대한민국 | 215 | 9.5% |
서울특별시와 | 203 | 8.9% |
관한 | 192 | 8.5% |
간 | 156 | 6.9% |
양해각서 | 122 | 5.4% |
우호 | 108 | 4.8% |
교류협력에 | 74 | 3.3% |
합의서 | 74 | 3.3% |
서울시와 | 63 | 2.8% |
중화인민공화국 | 55 | 2.4% |
Other values (141) | 1007 |
Most occurring characters
Value | Count | Frequency (%) |
1972 | 18.1% | |
서 | 595 | 5.5% |
시 | 515 | 4.7% |
한 | 437 | 4.0% |
국 | 354 | 3.2% |
협 | 334 | 3.1% |
와 | 332 | 3.0% |
울 | 302 | 2.8% |
간 | 295 | 2.7% |
민 | 283 | 2.6% |
Other values (188) | 5478 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 8719 | |
Space Separator | 1972 | 18.1% |
Lowercase Letter | 64 | 0.6% |
Uppercase Letter | 48 | 0.4% |
Dash Punctuation | 44 | 0.4% |
Close Punctuation | 21 | 0.2% |
Open Punctuation | 21 | 0.2% |
Other Punctuation | 8 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
서 | 595 | 6.8% |
시 | 515 | 5.9% |
한 | 437 | 5.0% |
국 | 354 | 4.1% |
협 | 334 | 3.8% |
와 | 332 | 3.8% |
울 | 302 | 3.5% |
간 | 295 | 3.4% |
민 | 283 | 3.2% |
력 | 251 | 2.9% |
Other values (176) | 5021 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 16 | |
i | 16 | |
v | 16 | |
r | 16 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 16 | |
L | 16 | |
R | 16 |
Space Separator
Value | Count | Frequency (%) |
1972 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 44 |
Close Punctuation
Value | Count | Frequency (%) |
) | 21 |
Open Punctuation
Value | Count | Frequency (%) |
( | 21 |
Other Punctuation
Value | Count | Frequency (%) |
, | 8 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 8719 | |
Common | 2066 | 19.0% |
Latin | 112 | 1.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
서 | 595 | 6.8% |
시 | 515 | 5.9% |
한 | 437 | 5.0% |
국 | 354 | 4.1% |
협 | 334 | 3.8% |
와 | 332 | 3.8% |
울 | 302 | 3.5% |
간 | 295 | 3.4% |
민 | 283 | 3.2% |
력 | 251 | 2.9% |
Other values (176) | 5021 |
Latin
Value | Count | Frequency (%) |
A | 16 | |
e | 16 | |
L | 16 | |
R | 16 | |
i | 16 | |
v | 16 | |
r | 16 |
Common
Value | Count | Frequency (%) |
1972 | ||
- | 44 | 2.1% |
) | 21 | 1.0% |
( | 21 | 1.0% |
, | 8 | 0.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 8719 | |
ASCII | 2178 | 20.0% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1972 | ||
- | 44 | 2.0% |
) | 21 | 1.0% |
( | 21 | 1.0% |
A | 16 | 0.7% |
e | 16 | 0.7% |
L | 16 | 0.7% |
R | 16 | 0.7% |
i | 16 | 0.7% |
v | 16 | 0.7% |
Other values (2) | 24 | 1.1% |
Hangul
Value | Count | Frequency (%) |
서 | 595 | 6.8% |
시 | 515 | 5.9% |
한 | 437 | 5.0% |
국 | 354 | 4.1% |
협 | 334 | 3.8% |
와 | 332 | 3.8% |
울 | 302 | 3.5% |
간 | 295 | 3.4% |
민 | 283 | 3.2% |
력 | 251 | 2.9% |
Other values (176) | 5021 |
주요내용
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 297 |
---|---|
Missing (%) | 100.0% |
Memory size | 2.7 KiB |
협정서
Categorical
HIGH CARDINALITY
  HIGH CORRELATION
 
Distinct | 51 |
---|---|
Distinct (%) | 17.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.4 KiB |
<NA> | |
---|---|
서울시-카트만두 우호도시 협정(160926).pdf | |
서울 휴스턴 우호도시.pdf | 16 |
서울 콜롬보 우호도시.pdf | 16 |
서울-중국 천진시간 협의서(한)_2009.4.12.jpg | 11 |
Other values (46) |
Length
Max length | 43 |
---|---|
Median length | 34 |
Mean length | 20.252525 |
Min length | 4 |
Unique
Unique | 16 ? |
---|---|
Unique (%) | 5.4% |
Sample
1st row | 우호도시협정체결 MOU 스캔본.pdf |
---|---|
2nd row | <NA> |
3rd row | 우호도시협정체결 MOU 스캔본.pdf |
4th row | 208. 서울-뉴저지주간 우호도시협정 MOU(국영) ('23.10).pdf |
5th row | 마드리드 MOU_En.pdf |
Common Values
Value | Count | Frequency (%) |
<NA> | 45 | 15.2% |
서울시-카트만두 우호도시 협정(160926).pdf | 33 | 11.1% |
서울 휴스턴 우호도시.pdf | 16 | 5.4% |
서울 콜롬보 우호도시.pdf | 16 | 5.4% |
서울-중국 천진시간 협의서(한)_2009.4.12.jpg | 11 | 3.7% |
서울-바르셀로나MOU(카탈란).jpg | 10 | 3.4% |
부다페스트_헝가리_우호도시.pdf | 9 | 3.0% |
테헤란시 우호도시 협정체결 협약서(171018).pdf | 9 | 3.0% |
서울시-민스크시 협정서.PDF | 9 | 3.0% |
서울-중국 산동성간 협의서(한)_2008.7.19.jpg | 9 | 3.0% |
Other values (41) | 130 |
Length
Value | Count | Frequency (%) |
서울 | 59 | 8.1% |
우호도시.pdf | 54 | 7.4% |
협정서.pdf | 52 | 7.1% |
우호도시 | 48 | 6.6% |
na | 45 | 6.2% |
서울-중국 | 43 | 5.9% |
협정(160926).pdf | 33 | 4.5% |
서울시-카트만두 | 33 | 4.5% |
휴스턴 | 16 | 2.2% |
콜롬보 | 16 | 2.2% |
Other values (86) | 331 |
성명(한글)
Text
MISSING
 
Distinct | 212 |
---|---|
Distinct (%) | 89.1% |
Missing | 59 |
Missing (%) | 19.9% |
Memory size | 2.4 KiB |
Value | Count | Frequency (%) |
엘가 | 9 | 1.7% |
샤프 | 9 | 1.7% |
안토니오 | 6 | 1.1% |
비야라이고사 | 6 | 1.1% |
리 | 5 | 0.9% |
에릭 | 4 | 0.8% |
알리 | 3 | 0.6% |
반 | 3 | 0.6% |
바하더 | 3 | 0.6% |
알 | 3 | 0.6% |
Other values (430) | 481 |
Most occurring characters
Value | Count | Frequency (%) |
295 | 16.6% | |
리 | 61 | 3.4% |
라 | 58 | 3.3% |
스 | 46 | 2.6% |
이 | 43 | 2.4% |
아 | 34 | 1.9% |
드 | 32 | 1.8% |
마 | 32 | 1.8% |
프 | 31 | 1.7% |
사 | 26 | 1.5% |
Other values (281) | 1120 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1475 | |
Space Separator | 295 | 16.6% |
Lowercase Letter | 7 | 0.4% |
Uppercase Letter | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
리 | 61 | 4.1% |
라 | 58 | 3.9% |
스 | 46 | 3.1% |
이 | 43 | 2.9% |
아 | 34 | 2.3% |
드 | 32 | 2.2% |
마 | 32 | 2.2% |
프 | 31 | 2.1% |
사 | 26 | 1.8% |
카 | 25 | 1.7% |
Other values (272) | 1087 |
Lowercase Letter
Value | Count | Frequency (%) |
s | 1 | |
k | 1 | |
i | 1 | |
o | 1 | |
w | 1 | |
n | 1 | |
a | 1 |
Space Separator
Value | Count | Frequency (%) |
295 |
Uppercase Letter
Value | Count | Frequency (%) |
J | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1475 | |
Common | 295 | 16.6% |
Latin | 8 | 0.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
리 | 61 | 4.1% |
라 | 58 | 3.9% |
스 | 46 | 3.1% |
이 | 43 | 2.9% |
아 | 34 | 2.3% |
드 | 32 | 2.2% |
마 | 32 | 2.2% |
프 | 31 | 2.1% |
사 | 26 | 1.8% |
카 | 25 | 1.7% |
Other values (272) | 1087 |
Latin
Value | Count | Frequency (%) |
s | 1 | |
k | 1 | |
i | 1 | |
o | 1 | |
w | 1 | |
n | 1 | |
a | 1 | |
J | 1 |
Common
Value | Count | Frequency (%) |
295 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1475 | |
ASCII | 303 | 17.0% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
295 | ||
s | 1 | 0.3% |
k | 1 | 0.3% |
i | 1 | 0.3% |
o | 1 | 0.3% |
w | 1 | 0.3% |
n | 1 | 0.3% |
a | 1 | 0.3% |
J | 1 | 0.3% |
Hangul
Value | Count | Frequency (%) |
리 | 61 | 4.1% |
라 | 58 | 3.9% |
스 | 46 | 3.1% |
이 | 43 | 2.9% |
아 | 34 | 2.3% |
드 | 32 | 2.2% |
마 | 32 | 2.2% |
프 | 31 | 2.1% |
사 | 26 | 1.8% |
카 | 25 | 1.7% |
Other values (272) | 1087 |
성명(원어)
Text
MISSING
 
Distinct | 248 |
---|---|
Distinct (%) | 87.9% |
Missing | 15 |
Missing (%) | 5.1% |
Memory size | 2.4 KiB |
Length
Max length | 50 |
---|---|
Median length | 35 |
Mean length | 16.964539 |
Min length | 3 |
Characters and Unicode
Total characters | 4784 |
---|---|
Distinct characters | 100 |
Distinct categories | 9 ? |
Distinct scripts | 5 ? |
Distinct blocks | 5 ? |
Unique
Unique | 232 ? |
---|---|
Unique (%) | 82.3% |
Sample
1st row | Naoise Ó Muirí |
---|---|
2nd row | Naoise Ó Muirí |
3rd row | Ana Botella |
4th row | Guy Morin |
5th row | Peer Visner |
Value | Count | Frequency (%) |
elga | 9 | 1.3% |
sharpe | 9 | 1.3% |
li | 7 | 1.0% |
de | 6 | 0.9% |
antonio | 6 | 0.9% |
villaraigosa | 6 | 0.9% |
bahadur | 5 | 0.7% |
michael | 5 | 0.7% |
eric | 5 | 0.7% |
adhikari | 4 | 0.6% |
Other values (519) | 630 |
Most occurring characters
Value | Count | Frequency (%) |
a | 565 | 11.8% |
435 | 9.1% | |
i | 319 | 6.7% |
n | 271 | 5.7% |
e | 266 | 5.6% |
r | 245 | 5.1% |
o | 196 | 4.1% |
h | 181 | 3.8% |
l | 147 | 3.1% |
u | 144 | 3.0% |
Other values (90) | 2015 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 3230 | |
Uppercase Letter | 928 | 19.4% |
Space Separator | 438 | 9.2% |
Other Punctuation | 84 | 1.8% |
Decimal Number | 47 | 1.0% |
Other Letter | 31 | 0.6% |
Open Punctuation | 10 | 0.2% |
Close Punctuation | 10 | 0.2% |
Dash Punctuation | 6 | 0.1% |
Most frequent character per category
Lowercase Letter
Value | Count | Frequency (%) |
a | 565 | |
i | 319 | |
n | 271 | 8.4% |
e | 266 | 8.2% |
r | 245 | 7.6% |
o | 196 | 6.1% |
h | 181 | 5.6% |
l | 147 | 4.6% |
u | 144 | 4.5% |
t | 125 | 3.9% |
Other values (16) | 771 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 92 | 9.9% |
M | 75 | 8.1% |
S | 66 | 7.1% |
R | 52 | 5.6% |
E | 50 | 5.4% |
H | 46 | 5.0% |
K | 46 | 5.0% |
B | 45 | 4.8% |
J | 40 | 4.3% |
L | 39 | 4.2% |
Other values (16) | 377 |
Other Letter
Value | Count | Frequency (%) |
高 | 2 | 6.5% |
橋 | 2 | 6.5% |
る | 2 | 6.5% |
み | 2 | 6.5% |
正 | 2 | 6.5% |
は | 2 | 6.5% |
家 | 1 | 3.2% |
瑞 | 1 | 3.2% |
政 | 1 | 3.2% |
隆 | 1 | 3.2% |
Other values (15) | 15 |
Decimal Number
Value | Count | Frequency (%) |
2 | 13 | |
5 | 7 | |
8 | 6 | |
3 | 4 | 8.5% |
9 | 3 | 6.4% |
1 | 3 | 6.4% |
4 | 3 | 6.4% |
0 | 3 | 6.4% |
6 | 3 | 6.4% |
7 | 2 | 4.3% |
Other Punctuation
Value | Count | Frequency (%) |
. | 21 | |
; | 21 | |
& | 21 | |
# | 10 | |
? | 6 | 7.1% |
, | 4 | 4.8% |
? | 1 | 1.2% |
Space Separator
Value | Count | Frequency (%) |
435 | ||
3 | 0.7% |
Close Punctuation
Value | Count | Frequency (%) |
) | 9 | |
) | 1 | 10.0% |
Open Punctuation
Value | Count | Frequency (%) |
( | 10 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 6 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 4158 | |
Common | 595 | 12.4% |
Han | 22 | 0.5% |
Hiragana | 6 | 0.1% |
Hangul | 3 | 0.1% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
a | 565 | 13.6% |
i | 319 | 7.7% |
n | 271 | 6.5% |
e | 266 | 6.4% |
r | 245 | 5.9% |
o | 196 | 4.7% |
h | 181 | 4.4% |
l | 147 | 3.5% |
u | 144 | 3.5% |
t | 125 | 3.0% |
Other values (42) | 1699 |
Common
Value | Count | Frequency (%) |
435 | ||
. | 21 | 3.5% |
; | 21 | 3.5% |
& | 21 | 3.5% |
2 | 13 | 2.2% |
( | 10 | 1.7% |
# | 10 | 1.7% |
) | 9 | 1.5% |
5 | 7 | 1.2% |
8 | 6 | 1.0% |
Other values (13) | 42 | 7.1% |
Han
Value | Count | Frequency (%) |
高 | 2 | 9.1% |
橋 | 2 | 9.1% |
正 | 2 | 9.1% |
家 | 1 | 4.5% |
瑞 | 1 | 4.5% |
政 | 1 | 4.5% |
隆 | 1 | 4.5% |
袁 | 1 | 4.5% |
行 | 1 | 4.5% |
篠 | 1 | 4.5% |
Other values (9) | 9 |
Hiragana
Value | Count | Frequency (%) |
る | 2 | |
み | 2 | |
は | 2 |
Hangul
Value | Count | Frequency (%) |
자 | 1 | |
숙 | 1 | |
안 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 4748 | |
CJK | 22 | 0.5% |
Hiragana | 6 | 0.1% |
None | 5 | 0.1% |
Hangul | 3 | 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
a | 565 | 11.9% |
435 | 9.2% | |
i | 319 | 6.7% |
n | 271 | 5.7% |
e | 266 | 5.6% |
r | 245 | 5.2% |
o | 196 | 4.1% |
h | 181 | 3.8% |
l | 147 | 3.1% |
u | 144 | 3.0% |
Other values (62) | 1979 |
None
Value | Count | Frequency (%) |
3 | ||
? | 1 | 20.0% |
) | 1 | 20.0% |
CJK
Value | Count | Frequency (%) |
高 | 2 | 9.1% |
橋 | 2 | 9.1% |
正 | 2 | 9.1% |
家 | 1 | 4.5% |
瑞 | 1 | 4.5% |
政 | 1 | 4.5% |
隆 | 1 | 4.5% |
袁 | 1 | 4.5% |
行 | 1 | 4.5% |
篠 | 1 | 4.5% |
Other values (9) | 9 |
Hiragana
Value | Count | Frequency (%) |
る | 2 | |
み | 2 | |
は | 2 |
Hangul
Value | Count | Frequency (%) |
자 | 1 | |
숙 | 1 | |
안 | 1 |
성별
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.4 KiB |
M | |
---|---|
F | |
<NA> |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 1.2929293 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | M |
---|---|
2nd row | <NA> |
3rd row | M |
4th row | <NA> |
5th row | F |
Common Values
Value | Count | Frequency (%) |
M | 203 | |
F | 65 | 21.9% |
<NA> | 29 | 9.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
m | 203 | |
f | 65 | 21.9% |
na | 29 | 9.8% |
소속
Text
MISSING
 
Distinct | 172 |
---|---|
Distinct (%) | 75.8% |
Missing | 70 |
Missing (%) | 23.6% |
Memory size | 2.4 KiB |
Length
Max length | 76 |
---|---|
Median length | 56 |
Mean length | 21.070485 |
Min length | 2 |
Characters and Unicode
Total characters | 4783 |
---|---|
Distinct characters | 235 |
Distinct categories | 11 ? |
Distinct scripts | 5 ? |
Distinct blocks | 5 ? |
Unique
Unique | 149 ? |
---|---|
Unique (%) | 65.6% |
Sample
1st row | Information Technology Department/ System Development |
---|---|
2nd row | Information Technology Department/ System Development |
3rd row | Information Systems DG |
4th row | 파나마시티 |
5th row | Tehran Traffic and Transportation Organization |
Value | Count | Frequency (%) |
department | 24 | 3.8% |
of | 22 | 3.5% |
city | 22 | 3.5% |
metropolitan | 20 | 3.2% |
kathmandu | 16 | 2.5% |
and | 14 | 2.2% |
office | 14 | 2.2% |
municipal | 13 | 2.1% |
state | 12 | 1.9% |
로스앤젤레스시 | 12 | 1.9% |
Other values (249) | 464 |
Most occurring characters
Value | Count | Frequency (%) |
425 | 8.9% | |
t | 357 | 7.5% |
n | 337 | 7.0% |
a | 310 | 6.5% |
e | 299 | 6.3% |
i | 298 | 6.2% |
o | 290 | 6.1% |
r | 202 | 4.2% |
m | 134 | 2.8% |
l | 123 | 2.6% |
Other values (225) | 2008 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 3071 | |
Other Letter | 709 | 14.8% |
Uppercase Letter | 521 | 10.9% |
Space Separator | 425 | 8.9% |
Other Punctuation | 39 | 0.8% |
Dash Punctuation | 4 | 0.1% |
Final Punctuation | 4 | 0.1% |
Initial Punctuation | 3 | 0.1% |
Decimal Number | 3 | 0.1% |
Open Punctuation | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
스 | 68 | 9.6% |
시 | 57 | 8.0% |
레 | 27 | 3.8% |
로 | 22 | 3.1% |
실 | 21 | 3.0% |
앤 | 18 | 2.5% |
젤 | 18 | 2.5% |
성 | 17 | 2.4% |
부 | 17 | 2.4% |
국 | 17 | 2.4% |
Other values (161) | 427 |
Lowercase Letter
Value | Count | Frequency (%) |
t | 357 | |
n | 337 | |
a | 310 | |
e | 299 | |
i | 298 | |
o | 290 | |
r | 202 | 6.6% |
m | 134 | 4.4% |
l | 123 | 4.0% |
p | 91 | 3.0% |
Other values (15) | 630 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 90 | |
M | 64 | |
D | 46 | 8.8% |
T | 38 | 7.3% |
I | 37 | 7.1% |
S | 36 | 6.9% |
O | 27 | 5.2% |
A | 27 | 5.2% |
F | 19 | 3.6% |
K | 18 | 3.5% |
Other values (13) | 119 |
Other Punctuation
Value | Count | Frequency (%) |
, | 10 | |
? | 8 | |
& | 8 | |
. | 5 | |
' | 5 | |
/ | 3 | 7.7% |
Decimal Number
Value | Count | Frequency (%) |
1 | 1 | |
4 | 1 | |
3 | 1 |
Final Punctuation
Value | Count | Frequency (%) |
” | 3 | |
’ | 1 | 25.0% |
Space Separator
Value | Count | Frequency (%) |
425 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 4 |
Initial Punctuation
Value | Count | Frequency (%) |
“ | 3 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 3592 | |
Hangul | 668 | 14.0% |
Common | 482 | 10.1% |
Han | 35 | 0.7% |
Katakana | 6 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
스 | 68 | 10.2% |
시 | 57 | 8.5% |
레 | 27 | 4.0% |
로 | 22 | 3.3% |
실 | 21 | 3.1% |
앤 | 18 | 2.7% |
젤 | 18 | 2.7% |
성 | 17 | 2.5% |
부 | 17 | 2.5% |
국 | 17 | 2.5% |
Other values (141) | 386 |
Latin
Value | Count | Frequency (%) |
t | 357 | 9.9% |
n | 337 | 9.4% |
a | 310 | 8.6% |
e | 299 | 8.3% |
i | 298 | 8.3% |
o | 290 | 8.1% |
r | 202 | 5.6% |
m | 134 | 3.7% |
l | 123 | 3.4% |
p | 91 | 2.5% |
Other values (38) | 1151 |
Han
Value | Count | Frequency (%) |
際 | 4 | 11.4% |
海 | 2 | 5.7% |
北 | 2 | 5.7% |
道 | 2 | 5.7% |
政 | 2 | 5.7% |
主 | 2 | 5.7% |
交 | 2 | 5.7% |
課 | 2 | 5.7% |
室 | 2 | 5.7% |
合 | 2 | 5.7% |
Other values (7) | 13 |
Common
Value | Count | Frequency (%) |
425 | ||
, | 10 | 2.1% |
? | 8 | 1.7% |
& | 8 | 1.7% |
. | 5 | 1.0% |
' | 5 | 1.0% |
- | 4 | 0.8% |
” | 3 | 0.6% |
“ | 3 | 0.6% |
/ | 3 | 0.6% |
Other values (6) | 8 | 1.7% |
Katakana
Value | Count | Frequency (%) |
プ | 2 | |
ル | 2 | |
グ | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 4067 | |
Hangul | 668 | 14.0% |
CJK | 35 | 0.7% |
Punctuation | 7 | 0.1% |
Katakana | 6 | 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
425 | 10.4% | |
t | 357 | 8.8% |
n | 337 | 8.3% |
a | 310 | 7.6% |
e | 299 | 7.4% |
i | 298 | 7.3% |
o | 290 | 7.1% |
r | 202 | 5.0% |
m | 134 | 3.3% |
l | 123 | 3.0% |
Other values (51) | 1292 |
Hangul
Value | Count | Frequency (%) |
스 | 68 | 10.2% |
시 | 57 | 8.5% |
레 | 27 | 4.0% |
로 | 22 | 3.3% |
실 | 21 | 3.1% |
앤 | 18 | 2.7% |
젤 | 18 | 2.7% |
성 | 17 | 2.5% |
부 | 17 | 2.5% |
국 | 17 | 2.5% |
Other values (141) | 386 |
CJK
Value | Count | Frequency (%) |
際 | 4 | 11.4% |
海 | 2 | 5.7% |
北 | 2 | 5.7% |
道 | 2 | 5.7% |
政 | 2 | 5.7% |
主 | 2 | 5.7% |
交 | 2 | 5.7% |
課 | 2 | 5.7% |
室 | 2 | 5.7% |
合 | 2 | 5.7% |
Other values (7) | 13 |
Punctuation
Value | Count | Frequency (%) |
” | 3 | |
“ | 3 | |
’ | 1 | 14.3% |
Katakana
Value | Count | Frequency (%) |
プ | 2 | |
ル | 2 | |
グ | 2 |
직위
Text
MISSING
 
Distinct | 133 |
---|---|
Distinct (%) | 55.2% |
Missing | 56 |
Missing (%) | 18.9% |
Memory size | 2.4 KiB |
Length
Max length | 100 |
---|---|
Median length | 79 |
Mean length | 12.854772 |
Min length | 2 |
Characters and Unicode
Total characters | 3098 |
---|---|
Distinct characters | 116 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 107 ? |
---|---|
Unique (%) | 44.4% |
Sample
1st row | Deputy Mayor |
---|---|
2nd row | Senior IT Developer |
3rd row | Deputy Director General |
4th row | Senior System Programmer |
5th row | System Programmer |
Value | Count | Frequency (%) |
시장 | 39 | 7.7% |
chief | 22 | 4.4% |
officer | 21 | 4.2% |
of | 20 | 4.0% |
director | 18 | 3.6% |
deputy | 14 | 2.8% |
담당 | 11 | 2.2% |
division | 10 | 2.0% |
senior | 10 | 2.0% |
의전실장 | 10 | 2.0% |
Other values (162) | 330 |
Most occurring characters
Value | Count | Frequency (%) |
283 | 9.1% | |
e | 274 | 8.8% |
i | 230 | 7.4% |
r | 194 | 6.3% |
t | 187 | 6.0% |
n | 184 | 5.9% |
a | 160 | 5.2% |
o | 153 | 4.9% |
f | 112 | 3.6% |
c | 98 | 3.2% |
Other values (106) | 1223 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 2082 | |
Uppercase Letter | 359 | 11.6% |
Other Letter | 327 | 10.6% |
Space Separator | 283 | 9.1% |
Other Punctuation | 28 | 0.9% |
Close Punctuation | 8 | 0.3% |
Open Punctuation | 8 | 0.3% |
Decimal Number | 3 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
장 | 87 | |
시 | 50 | |
담 | 12 | 3.7% |
당 | 11 | 3.4% |
의 | 11 | 3.4% |
전 | 11 | 3.4% |
실 | 11 | 3.4% |
국 | 11 | 3.4% |
대 | 10 | 3.1% |
성 | 9 | 2.8% |
Other values (51) | 104 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 274 | |
i | 230 | |
r | 194 | |
t | 187 | |
n | 184 | |
a | 160 | 7.7% |
o | 153 | 7.3% |
f | 112 | 5.4% |
c | 98 | 4.7% |
s | 73 | 3.5% |
Other values (15) | 417 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 54 | |
D | 50 | |
S | 47 | |
M | 31 | |
E | 30 | |
O | 29 | |
I | 18 | 5.0% |
P | 17 | 4.7% |
T | 15 | 4.2% |
A | 15 | 4.2% |
Other values (11) | 53 |
Other Punctuation
Value | Count | Frequency (%) |
, | 16 | |
. | 5 | 17.9% |
? | 4 | 14.3% |
& | 2 | 7.1% |
/ | 1 | 3.6% |
Space Separator
Value | Count | Frequency (%) |
283 |
Close Punctuation
Value | Count | Frequency (%) |
) | 8 |
Open Punctuation
Value | Count | Frequency (%) |
( | 8 |
Decimal Number
Value | Count | Frequency (%) |
1 | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 2441 | |
Common | 330 | 10.7% |
Hangul | 327 | 10.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
장 | 87 | |
시 | 50 | |
담 | 12 | 3.7% |
당 | 11 | 3.4% |
의 | 11 | 3.4% |
전 | 11 | 3.4% |
실 | 11 | 3.4% |
국 | 11 | 3.4% |
대 | 10 | 3.1% |
성 | 9 | 2.8% |
Other values (51) | 104 |
Latin
Value | Count | Frequency (%) |
e | 274 | 11.2% |
i | 230 | 9.4% |
r | 194 | 7.9% |
t | 187 | 7.7% |
n | 184 | 7.5% |
a | 160 | 6.6% |
o | 153 | 6.3% |
f | 112 | 4.6% |
c | 98 | 4.0% |
s | 73 | 3.0% |
Other values (36) | 776 |
Common
Value | Count | Frequency (%) |
283 | ||
, | 16 | 4.8% |
) | 8 | 2.4% |
( | 8 | 2.4% |
. | 5 | 1.5% |
? | 4 | 1.2% |
1 | 3 | 0.9% |
& | 2 | 0.6% |
/ | 1 | 0.3% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 2771 | |
Hangul | 327 | 10.6% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
283 | 10.2% | |
e | 274 | 9.9% |
i | 230 | 8.3% |
r | 194 | 7.0% |
t | 187 | 6.7% |
n | 184 | 6.6% |
a | 160 | 5.8% |
o | 153 | 5.5% |
f | 112 | 4.0% |
c | 98 | 3.5% |
Other values (45) | 896 |
Hangul
Value | Count | Frequency (%) |
장 | 87 | |
시 | 50 | |
담 | 12 | 3.7% |
당 | 11 | 3.4% |
의 | 11 | 3.4% |
전 | 11 | 3.4% |
실 | 11 | 3.4% |
국 | 11 | 3.4% |
대 | 10 | 3.1% |
성 | 9 | 2.8% |
Other values (51) | 104 |
취임일
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 21 |
---|---|
Distinct (%) | 77.8% |
Missing | 270 |
Missing (%) | 90.9% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20110764 |
Minimum | 20010616 |
---|---|
Maximum | 20171204 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.7 KiB |
Quantile statistics
Minimum | 20010616 |
---|---|
5-th percentile | 20030423 |
Q1 | 20065866 |
median | 20130601 |
Q3 | 20155656 |
95-th percentile | 20171060 |
Maximum | 20171204 |
Range | 160588 |
Interquartile range (IQR) | 89790.5 |
Descriptive statistics
Standard deviation | 50951.518 |
---|---|
Coefficient of variation (CV) | 0.0025335446 |
Kurtosis | -1.003472 |
Mean | 20110764 |
Median Absolute Deviation (MAD) | 30425 |
Skewness | -0.50263582 |
Sum | 5.4299062 × 108 |
Variance | 2.5960571 × 109 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20130601 | 3 | 1.0% |
20050701 | 3 | 1.0% |
20110601 | 2 | 0.7% |
20030423 | 2 | 0.7% |
20101003 | 1 | 0.3% |
20101201 | 1 | 0.3% |
20141211 | 1 | 0.3% |
20010616 | 1 | 0.3% |
20100707 | 1 | 0.3% |
20171204 | 1 | 0.3% |
Other values (11) | 11 | 3.7% |
(Missing) | 270 |
Value | Count | Frequency (%) |
20010616 | 1 | 0.3% |
20030423 | 2 | |
20040328 | 1 | 0.3% |
20050701 | 3 | |
20081030 | 1 | 0.3% |
20100707 | 1 | 0.3% |
20101003 | 1 | 0.3% |
20101201 | 1 | 0.3% |
20110601 | 2 | |
20130601 | 3 |
Value | Count | Frequency (%) |
20171204 | 1 | |
20171116 | 1 | |
20170928 | 1 | |
20170827 | 1 | |
20170531 | 1 | |
20161026 | 1 | |
20160102 | 1 | |
20151210 | 1 | |
20141211 | 1 | |
20130916 | 1 |
이임일
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.4 KiB |
<NA> | |
---|---|
20130601 | 3 |
Length
Max length | 8 |
---|---|
Median length | 4 |
Mean length | 4.040404 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 294 | |
20130601 | 3 | 1.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 294 | |
20130601 | 3 | 1.0% |
교류현황
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 297 |
---|---|
Missing (%) | 100.0% |
Memory size | 2.7 KiB |
대륙명 | 국가명 | 도시명 | 체결년도 | 결연체결일 | 결연자 | 결연장소 | 협정서명 | 협정서 | 성별 | 취임일 | |
---|---|---|---|---|---|---|---|---|---|---|---|
대륙명 | 1.000 | 1.000 | 0.999 | 0.553 | 0.551 | 0.313 | 0.784 | 1.000 | 0.999 | 0.066 | 0.598 |
국가명 | 1.000 | 1.000 | 1.000 | 0.975 | 0.974 | 0.991 | 0.979 | 1.000 | 1.000 | 0.266 | 0.838 |
도시명 | 0.999 | 1.000 | 1.000 | 0.999 | 0.997 | 1.000 | 0.999 | 1.000 | 1.000 | 0.366 | 0.924 |
체결년도 | 0.553 | 0.975 | 0.999 | 1.000 | 0.999 | 0.876 | 0.965 | 1.000 | 1.000 | 0.167 | 0.650 |
결연체결일 | 0.551 | 0.974 | 0.997 | 0.999 | 1.000 | 0.844 | 0.966 | 1.000 | 0.999 | 0.079 | 0.218 |
결연자 | 0.313 | 0.991 | 1.000 | 0.876 | 0.844 | 1.000 | 0.967 | 1.000 | 1.000 | 0.269 | 0.503 |
결연장소 | 0.784 | 0.979 | 0.999 | 0.965 | 0.966 | 0.967 | 1.000 | 1.000 | 1.000 | 0.000 | 0.746 |
협정서명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.348 | 0.782 |
협정서 | 0.999 | 1.000 | 1.000 | 1.000 | 0.999 | 1.000 | 1.000 | 1.000 | 1.000 | 0.264 | 0.827 |
성별 | 0.066 | 0.266 | 0.366 | 0.167 | 0.079 | 0.269 | 0.000 | 0.348 | 0.264 | 1.000 | 0.611 |
취임일 | 0.598 | 0.838 | 0.924 | 0.650 | 0.218 | 0.503 | 0.746 | 0.782 | 0.827 | 0.611 | 1.000 |
국가명 | 이임일 | 대륙명 | 결연장소 | 협정서 | 성별 | 결연자 | |
---|---|---|---|---|---|---|---|
국가명 | 1.000 | 1.000 | 0.945 | 0.671 | 0.952 | 0.197 | 0.886 |
이임일 | 1.000 | 1.000 | 1.000 | 1.000 | NaN | 1.000 | 1.000 |
대륙명 | 0.945 | 1.000 | 1.000 | 0.451 | 0.899 | 0.069 | 0.192 |
결연장소 | 0.671 | 1.000 | 0.451 | 1.000 | 0.950 | 0.000 | 0.806 |
협정서 | 0.952 | NaN | 0.899 | 0.950 | 1.000 | 0.188 | 0.905 |
성별 | 0.197 | 1.000 | 0.069 | 0.000 | 0.188 | 1.000 | 0.192 |
결연자 | 0.886 | 1.000 | 0.192 | 0.806 | 0.905 | 0.192 | 1.000 |
체결년도 | 결연체결일 | 취임일 | 대륙명 | 국가명 | 결연자 | 결연장소 | 협정서 | 성별 | 이임일 | |
---|---|---|---|---|---|---|---|---|---|---|
체결년도 | 1.000 | 0.996 | 0.357 | 0.342 | 0.800 | 0.694 | 0.777 | 0.903 | 0.122 | 1.000 |
결연체결일 | 0.996 | 1.000 | 0.350 | 0.327 | 0.792 | 0.674 | 0.772 | 0.904 | 0.061 | 1.000 |
취임일 | 0.357 | 0.350 | 1.000 | 0.313 | 0.403 | 0.333 | 0.514 | 0.172 | 0.355 | 1.000 |
대륙명 | 0.342 | 0.327 | 0.313 | 1.000 | 0.945 | 0.192 | 0.451 | 0.899 | 0.069 | 1.000 |
국가명 | 0.800 | 0.792 | 0.403 | 0.945 | 1.000 | 0.886 | 0.671 | 0.952 | 0.197 | 1.000 |
결연자 | 0.694 | 0.674 | 0.333 | 0.192 | 0.886 | 1.000 | 0.806 | 0.905 | 0.192 | 1.000 |
결연장소 | 0.777 | 0.772 | 0.514 | 0.451 | 0.671 | 0.806 | 1.000 | 0.950 | 0.000 | 1.000 |
협정서 | 0.903 | 0.904 | 0.172 | 0.899 | 0.952 | 0.905 | 0.950 | 1.000 | 0.188 | 0.000 |
성별 | 0.122 | 0.061 | 0.355 | 0.069 | 0.197 | 0.192 | 0.000 | 0.188 | 1.000 | 1.000 |
이임일 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 1.000 | 1.000 |
대륙명 | 국가명 | 도시명 | 협정구분 | 분야 | 체결년도 | 결연체결일 | 결연자 | 결연장소 | 협정서명 | 주요내용 | 협정서 | 성명(한글) | 성명(원어) | 성별 | 소속 | 직위 | 취임일 | 이임일 | 교류현황 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 유럽 | 아일랜드 | 더블린 | 우호도시 | <NA> | 2023 | 20230316 | 오세훈 | 더블린 맨션하우스 | 아일랜드 더블린 시와 대한민국 서울특별시간 우호협정서 | <NA> | 우호도시협정체결 MOU 스캔본.pdf | <NA> | Naoise Ó Muirí | M | <NA> | <NA> | <NA> | <NA> | <NA> |
1 | 북아메리카 | 미국 | 기타 | 우호도시 | <NA> | 2023 | 20230216 | 오세훈 | 서울시청 시장 집무실 | 우호 및 협력관계에 관한 양해각서 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
2 | 유럽 | 아일랜드 | 더블린 | 우호도시 | <NA> | 2023 | 20230316 | 오세훈 | 더블린 맨션하우스 | 아일랜드 더블린 시와 대한민국 서울특별시간 우호협정서 | <NA> | 우호도시협정체결 MOU 스캔본.pdf | <NA> | Naoise Ó Muirí | M | <NA> | <NA> | <NA> | <NA> | <NA> |
3 | 북아메리카 | 미국 | 뉴저지 | 우호도시 | <NA> | 2023 | 20231018 | 오세훈 | 대한민국 서울 | 대한민국 서울특별시와 미합중국 뉴저지주 간 우호 협력도시 체결을 위한 협약서 | <NA> | 208. 서울-뉴저지주간 우호도시협정 MOU(국영) ('23.10).pdf | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
4 | 유럽 | 스페인 | 마드리드 | 우호도시 | <NA> | 2022 | 20221026 | 오세훈 | 마드리드 시청사 | 서울특별시(대한민국) 및 마드리드시 (스페인왕국) 간 우호협력 결연에 관한 양해각서 | <NA> | 마드리드 MOU_En.pdf | <NA> | Ana Botella | F | <NA> | <NA> | <NA> | <NA> | <NA> |
5 | 유럽 | 스위스 | 바젤 | 우호도시 | <NA> | 2022 | 20220929 | 오세훈 | 서울시청 8층 간담회장1 | 대한민국 서울특별시와 스위스 바젤슈타트주 간 우호 및 협력관계에 관한 양해각서 | <NA> | 180. 서울-바젤슈타트 우호협력도시 합의서.pdf | <NA> | Guy Morin | M | <NA> | <NA> | <NA> | <NA> | <NA> |
6 | 남아메리카 | 콜롬비아 | 메데진 | 우호도시 | <NA> | 2019 | 20190712 | 박원순 | 메데진 | 우호협력 결연에 대한 양해각서 | <NA> | Seoul_Medellin MOU_(19.7.12).pdf | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
7 | 아시아 | 이스라엘 | 텔아비브 | 우호도시 | <NA> | 2019 | 20190506 | 박원순 | 텔아비브 | 대한민국 서울시와 이스라엘 텔아비브시 간 우호 교류 협력을 위한 양해각서 | <NA> | 20190506_서울시 텔아비브 우호도시 MOU 협약문.pdf | <NA> | Peer Visner | <NA> | <NA> | Deputy Mayor | <NA> | <NA> | <NA> |
8 | 아시아 | 이스라엘 | 텔아비브 | 우호도시 | <NA> | 2019 | 20190506 | 박원순 | 텔아비브 | 대한민국 서울시와 이스라엘 텔아비브시 간 우호 교류 협력을 위한 양해각서 | <NA> | 20190506_서울시 텔아비브 우호도시 MOU 협약문.pdf | <NA> | Ron Huldai | M | <NA> | <NA> | <NA> | <NA> | <NA> |
9 | 아시아 | 중국 | 충칭 | 우호도시 | <NA> | 2019 | 20190530 | 박원순 | 서울시 | 대한민국 서울특별시와 중화인민공화국 충칭시 간 우호교류와 협력에 관한 협의서 | <NA> | 서울-충칭 우호도시협의서 체결본(2019.5.30).pdf | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
대륙명 | 국가명 | 도시명 | 협정구분 | 분야 | 체결년도 | 결연체결일 | 결연자 | 결연장소 | 협정서명 | 주요내용 | 협정서 | 성명(한글) | 성명(원어) | 성별 | 소속 | 직위 | 취임일 | 이임일 | 교류현황 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
287 | 유럽 | 네덜란드 | 암스테르담 | 우호도시 | <NA> | 1999 | 19990315 | 고건 | 암스테르담 | 서울특별시와 암스테르담시간의 교류와 협력에 관한 합의각서 | <NA> | 서울시-암스테르담시 협정서.PDF | 에베르할드 반 데르 랜 | Eberhard Edzard van der Laan | M | Mayor of Amsterdam | 시장 | 20100707 | <NA> | <NA> |
288 | 유럽 | 독일 | 베를린 | 우호도시 | <NA> | 1997 | 19970423 | 조순 | 베를린 | 서울특별시-베를린시간 사업협력 및 교류에 관한 각서 | <NA> | 서울시-베를린시 협정서.PDF | <NA> | Rolf Sch?te | <NA> | 베른시 국제협력과 | 의전과장 | <NA> | <NA> | <NA> |
289 | 북아메리카 | 캐나다 | 오타와 | 우호도시 | <NA> | 1997 | 19970110 | 조순 | 서울시청 | 대한민국 서울특별시와 카나다 오타와시 간 도시정보교류에 관한 양해각서 | <NA> | 서울시-오타와시 협정서.PDF | 케이씨 보울즈 | Cathy Bowles | F | 토론토시 의전실 | 의전실장 | <NA> | <NA> | <NA> |
290 | 유럽 | 독일 | 베를린 | 우호도시 | <NA> | 1997 | 19970423 | 조순 | 베를린 | 서울특별시-베를린시간 사업협력 및 교류에 관한 각서 | <NA> | 서울시-베를린시 협정서.PDF | 클라우스 보베라이트 | Klaus Wowereit | M | Mayor of Berlin | 시장 | 20010616 | <NA> | <NA> |
291 | 유럽 | 독일 | 베를린 | 우호도시 | <NA> | 1997 | 19970423 | 조순 | 베를린 | 서울특별시-베를린시간 사업협력 및 교류에 관한 각서 | <NA> | 서울시-베를린시 협정서.PDF | 마이클 뮐러 | Michael Müller | M | 베를린 | 시장 | 20141211 | <NA> | <NA> |
292 | 유럽 | 독일 | 베를린 | 우호도시 | <NA> | 1997 | 19970423 | 조순 | 베를린 | 서울특별시-베를린시간 사업협력 및 교류에 관한 각서 | <NA> | 서울시-베를린시 협정서.PDF | 크리스찬 개블러 | Christian Gaebler | M | 베를린시 | 도시개발 및 환경정책 대표 | <NA> | <NA> | <NA> |
293 | 유럽 | 독일 | 베를린 | 우호도시 | <NA> | 1997 | 19970423 | 조순 | 베를린 | 서울특별시-베를린시간 사업협력 및 교류에 관한 각서 | <NA> | 서울시-베를린시 협정서.PDF | Janowski | Janowski, Jan | M | <NA> | 학생 | <NA> | <NA> | <NA> |
294 | 유럽 | 독일 | 베를린 | 우호도시 | <NA> | 1997 | 19970423 | 조순 | 베를린 | 서울특별시-베를린시간 사업협력 및 교류에 관한 각서 | <NA> | 서울시-베를린시 협정서.PDF | <NA> | Karl-Heinz Loeper | <NA> | 베를린시 | CIO | <NA> | <NA> | <NA> |
295 | 북아메리카 | 캐나다 | 오타와 | 우호도시 | <NA> | 1997 | 19970110 | 조순 | 서울시청 | 대한민국 서울특별시와 카나다 오타와시 간 도시정보교류에 관한 양해각서 | <NA> | 서울시-오타와시 협정서.PDF | 짐 왓슨 | Jim Watson | M | 오타와 | 시장 | 20101201 | <NA> | <NA> |
296 | 유럽 | 독일 | 베를린 | 우호도시 | <NA> | 1997 | 19970423 | 조순 | 베를린 | 서울특별시-베를린시간 사업협력 및 교류에 관한 각서 | <NA> | 서울시-베를린시 협정서.PDF | 에스더 켈러 | Esther.Keller | F | Director of Protocol/International Relations | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
대륙명 | 국가명 | 도시명 | 협정구분 | 체결년도 | 결연체결일 | 결연자 | 결연장소 | 협정서명 | 협정서 | 성명(한글) | 성명(원어) | 성별 | 소속 | 직위 | 취임일 | 이임일 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | 북아메리카 | 미국 | 로스엔젤레스 | 우호도시 | 2006 | 20061016 | 오세훈 | 서울시청 | 대한민국 서울시와 미합중국 로스앤젤레스 간 경제협력에 관한 양해각서, 대한민국 서울시와 미합중국 로스앤젤레스 간 자매하천(청계천-LA River) 양해각서 | <NA> | 엘가 샤프 | Elga Sharpe | F | 로스앤젤레스시 시장실 | 의전실장 | <NA> | <NA> | 3 |
2 | 북아메리카 | 미국 | 로스엔젤레스 | 우호도시 | 2006 | 20061016 | 오세훈 | 서울시청 | 대한민국 서울시와 미합중국 로스앤젤레스 간 자매하천(청계천-LA River) 양해각서 | <NA> | 엘가 샤프 | Elga Sharpe | F | 로스앤젤레스시 시장실 | 의전실장 | <NA> | <NA> | 3 |
3 | 북아메리카 | 미국 | 로스엔젤레스 | 우호도시 | 2010 | 20101116 | 오세훈 | 로스앤젤레스시청 | 서울특별시와 로스앤젤레스 간 대기질 개선과 온실가스 감축을 위한 전기차 보급 양해각서 | <NA> | 엘가 샤프 | Elga Sharpe | F | 로스앤젤레스시 시장실 | 의전실장 | <NA> | <NA> | 3 |
0 | 남아메리카 | 아르헨티나 | 부에노스아이레스 | 우호도시 | 2012 | 20120625 | 박원순 | 부에노스아이레스 | 아르헨티나 부에노스아이레스와 대한민국 서울특별시간 우호협력에 관한 양해각서 | 서울시-부에노스아이레스 협정서.pdf | <NA> | Mauricio Macri | M | <NA> | <NA> | <NA> | <NA> | 2 |
4 | 북아메리카 | 미국 | 휴스턴 | 우호도시 | 2014 | 20141001 | 박원순 | 서울 | 대한민국 서울특별시와 미합중국 휴스턴시 간 우호 교류협력에 관한 양해각서 | 서울 휴스턴 우호도시.pdf | 리처드 스미스 | Richard M. Smith | M | Pinkerton Foundation | President | <NA> | <NA> | 2 |
5 | 아시아 | 네팔 | 카투만두 | 우호도시 | 2016 | 20160926 | 박원순 | 서울 | 대한민국 서울특별시와 네팔 카트만두시 간 우호 교류협력에 관한 합의서 | 서울시-카트만두 우호도시 협정(160926).pdf | 빠담 케샤 아디카리 | Padam Keshar Adhikari | M | International relations Secretariat Kathmandu Metropolitan City office | <NA> | <NA> | <NA> | 2 |
6 | 아시아 | 우즈베키스탄 | 타슈켄트 | 우호도시 | 2006 | 20060330 | 이명박 | 서울시청 | 서울시와 타슈켄트시간우호협력협정서 | <NA> | 투크타예브 | Tukhtaev Abdukahhor | M | 타슈켄트시 | 시장 | <NA> | <NA> | 2 |
7 | 아시아 | 중국 | 저장성 | 우호도시 | 2009 | 20090410 | 오세훈 | 저장성 항저우시 | 대한민국 서울특별시와 중화인민공화국 절강성간 우호협력에 관한 협의서 | 서울-중국 절강성간 협의서(한)_2009.4.10.jpg | <NA> | Li Qiang | M | <NA> | <NA> | <NA> | <NA> | 2 |
8 | 아시아 | 중국 | 텐진 | 우호도시 | 2009 | 20090412 | 오세훈 | 톈진시 | 대한민국 서울특별시와 중화인민공화국 천진시간 우호 교류와 협력에 관한 협의서 | 서울-중국 천진시간 협의서(한)_2009.4.12.jpg | <NA> | Huang Xingguo | M | <NA> | <NA> | <NA> | <NA> | 2 |
9 | 유럽 | 스페인 | 바르셀로나 | 우호도시 | 2012 | 20121113 | 박원순 | 바르셀로나 | 서울시와 바르셀로나시간 우호협력 양해각서 | 서울-바르셀로나MOU(카탈란).jpg | 조안 바틀 | Joan Batlle | M | International Cooperation | <NA> | <NA> | <NA> | 2 |