Overview

Dataset statistics

Number of variables9
Number of observations2851
Missing cells1860
Missing cells (%)7.2%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory206.2 KiB
Average record size in memory74.0 B

Variable types

Text4
Categorical3
Numeric2

Alerts

출처 is highly overall correlated with 시작지점 and 3 other fieldsHigh correlation
분야 is highly overall correlated with 시작지점 and 3 other fieldsHigh correlation
시작지점 is highly overall correlated with 종료시점 and 3 other fieldsHigh correlation
종료시점 is highly overall correlated with 시작지점 and 3 other fieldsHigh correlation
주기 is highly overall correlated with 시작지점 and 3 other fieldsHigh correlation
주기 is highly imbalanced (71.7%)Imbalance
유의사항 has 1860 (65.2%) missing valuesMissing
시작지점 is highly skewed (γ1 = 37.73484435)Skewed
종료시점 is highly skewed (γ1 = 20.11793127)Skewed
통계표ID has unique valuesUnique

Reproduction

Analysis started2024-05-03 19:29:58.550519
Analysis finished2024-05-03 19:30:02.344279
Duration3.79 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

통계표ID
Text

UNIQUE 

Distinct2851
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size22.4 KiB
2024-05-03T19:30:02.621279image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length23
Median length20
Mean length12.709926
Min length10

Characters and Unicode

Total characters36236
Distinct characters33
Distinct categories3 ?
Distinct scripts2 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique2851 ?
Unique (%)100.0%

Sample

1st rowDT_210012_012
2nd rowDT_210012_013
3rd rowDT_210012_011
4th rowDT_210012_014
5th rowDT_210012_006
ValueCountFrequency (%)
dt_210012_012 1
 
< 0.1%
tx_210040392_2 1
 
< 0.1%
tx_210040388_3_1 1
 
< 0.1%
tx_210040384_1 1
 
< 0.1%
tx_210040388_3 1
 
< 0.1%
tx_210040314 1
 
< 0.1%
tx_210040313 1
 
< 0.1%
tx_210040382 1
 
< 0.1%
tx_210040383 1
 
< 0.1%
tx_210040385_1 1
 
< 0.1%
Other values (2841) 2841
99.6%
2024-05-03T19:30:03.543030image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
0 8717
24.1%
1 5293
14.6%
_ 4455
12.3%
2 4199
11.6%
T 2914
 
8.0%
D 2830
 
7.8%
4 1152
 
3.2%
3 811
 
2.2%
7 709
 
2.0%
8 644
 
1.8%
Other values (23) 4512
12.5%

Most occurring categories

ValueCountFrequency (%)
Decimal Number 22854
63.1%
Uppercase Letter 8927
 
24.6%
Connector Punctuation 4455
 
12.3%

Most frequent character per category

Uppercase Letter
ValueCountFrequency (%)
T 2914
32.6%
D 2830
31.7%
G 297
 
3.3%
E 272
 
3.0%
S 235
 
2.6%
U 229
 
2.6%
N 222
 
2.5%
O 212
 
2.4%
B 209
 
2.3%
K 196
 
2.2%
Other values (12) 1311
14.7%
Decimal Number
ValueCountFrequency (%)
0 8717
38.1%
1 5293
23.2%
2 4199
18.4%
4 1152
 
5.0%
3 811
 
3.5%
7 709
 
3.1%
8 644
 
2.8%
5 554
 
2.4%
6 415
 
1.8%
9 360
 
1.6%
Connector Punctuation
ValueCountFrequency (%)
_ 4455
100.0%

Most occurring scripts

ValueCountFrequency (%)
Common 27309
75.4%
Latin 8927
 
24.6%

Most frequent character per script

Latin
ValueCountFrequency (%)
T 2914
32.6%
D 2830
31.7%
G 297
 
3.3%
E 272
 
3.0%
S 235
 
2.6%
U 229
 
2.6%
N 222
 
2.5%
O 212
 
2.4%
B 209
 
2.3%
K 196
 
2.2%
Other values (12) 1311
14.7%
Common
ValueCountFrequency (%)
0 8717
31.9%
1 5293
19.4%
_ 4455
16.3%
2 4199
15.4%
4 1152
 
4.2%
3 811
 
3.0%
7 709
 
2.6%
8 644
 
2.4%
5 554
 
2.0%
6 415
 
1.5%

Most occurring blocks

ValueCountFrequency (%)
ASCII 36236
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
0 8717
24.1%
1 5293
14.6%
_ 4455
12.3%
2 4199
11.6%
T 2914
 
8.0%
D 2830
 
7.8%
4 1152
 
3.2%
3 811
 
2.2%
7 709
 
2.0%
8 644
 
1.8%
Other values (23) 4512
12.5%

분야
Categorical

HIGH CORRELATION 

Distinct14
Distinct (%)0.5%
Missing0
Missing (%)0.0%
Memory size22.4 KiB
경기도기본통계 통계연보41년사
1172 
사회조사
660 
청년통계
347 
경기도기본통계연보
310 
경기도아동가구주거실태조사
 
102
Other values (9)
260 

Length

Max length19
Median length16
Mean length10.604349
Min length3

Unique

Unique3 ?
Unique (%)0.1%

Sample

1st row경기도 주요 관광지 방문객 실태조사
2nd row경기도 주요 관광지 방문객 실태조사
3rd row경기도 주요 관광지 방문객 실태조사
4th row경기도 주요 관광지 방문객 실태조사
5th row경기도 주요 관광지 방문객 실태조사

Common Values

ValueCountFrequency (%)
경기도기본통계 통계연보41년사 1172
41.1%
사회조사 660
23.1%
청년통계 347
 
12.2%
경기도기본통계연보 310
 
10.9%
경기도아동가구주거실태조사 102
 
3.6%
경기도 주요 관광지 방문객 실태조사 95
 
3.3%
경기도콘텐츠산업실태조사 94
 
3.3%
사업체조사 42
 
1.5%
장래인구추계 19
 
0.7%
주민등록인구통계 5
 
0.2%
Other values (4) 5
 
0.2%

Length

2024-05-03T19:30:03.931020image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
경기도기본통계 1172
26.6%
통계연보41년사 1172
26.6%
사회조사 660
15.0%
청년통계 347
 
7.9%
경기도기본통계연보 310
 
7.0%
경기도아동가구주거실태조사 102
 
2.3%
관광지 95
 
2.2%
방문객 95
 
2.2%
실태조사 95
 
2.2%
주요 95
 
2.2%
Other values (11) 262
 
5.9%
Distinct74
Distinct (%)2.6%
Missing0
Missing (%)0.0%
Memory size22.4 KiB
2024-05-03T19:30:04.353504image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length21
Median length15
Mean length5.8495265
Min length2

Characters and Unicode

Total characters16677
Distinct characters139
Distinct categories6 ?
Distinct scripts2 ?
Distinct blocks4 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique3 ?
Unique (%)0.1%

Sample

1st row경기도 여행인식
2nd row경기도 여행인식
3rd row경기도 여행인식
4th row경기도 여행인식
5th row경기도 여행인식
ValueCountFrequency (%)
농림/수산업 284
 
8.2%
2023 152
 
4.4%
2021 149
 
4.3%
공공행정/사법 141
 
4.1%
2019 134
 
3.9%
2017 132
 
3.8%
131
 
3.8%
보건/사회보장 129
 
3.7%
교육/문화 120
 
3.5%
2011이전 113
 
3.3%
Other values (86) 1981
57.2%
2024-05-03T19:30:05.209759image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
2 1499
 
9.0%
/ 1418
 
8.5%
0 1048
 
6.3%
1 939
 
5.6%
615
 
3.7%
556
 
3.3%
525
 
3.1%
448
 
2.7%
425
 
2.5%
396
 
2.4%
Other values (129) 8808
52.8%

Most occurring categories

ValueCountFrequency (%)
Other Letter 10356
62.1%
Decimal Number 4165
25.0%
Other Punctuation 1505
 
9.0%
Space Separator 615
 
3.7%
Close Punctuation 18
 
0.1%
Open Punctuation 18
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
556
 
5.4%
525
 
5.1%
448
 
4.3%
425
 
4.1%
396
 
3.8%
395
 
3.8%
344
 
3.3%
330
 
3.2%
330
 
3.2%
301
 
2.9%
Other values (113) 6306
60.9%
Decimal Number
ValueCountFrequency (%)
2 1499
36.0%
0 1048
25.2%
1 939
22.5%
3 195
 
4.7%
9 143
 
3.4%
7 132
 
3.2%
8 60
 
1.4%
5 56
 
1.3%
4 51
 
1.2%
6 42
 
1.0%
Other Punctuation
ValueCountFrequency (%)
/ 1418
94.2%
. 64
 
4.3%
· 23
 
1.5%
Space Separator
ValueCountFrequency (%)
615
100.0%
Close Punctuation
ValueCountFrequency (%)
] 18
100.0%
Open Punctuation
ValueCountFrequency (%)
[ 18
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 10356
62.1%
Common 6321
37.9%

Most frequent character per script

Hangul
ValueCountFrequency (%)
556
 
5.4%
525
 
5.1%
448
 
4.3%
425
 
4.1%
396
 
3.8%
395
 
3.8%
344
 
3.3%
330
 
3.2%
330
 
3.2%
301
 
2.9%
Other values (113) 6306
60.9%
Common
ValueCountFrequency (%)
2 1499
23.7%
/ 1418
22.4%
0 1048
16.6%
1 939
14.9%
615
9.7%
3 195
 
3.1%
9 143
 
2.3%
7 132
 
2.1%
. 64
 
1.0%
8 60
 
0.9%
Other values (6) 208
 
3.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 10347
62.0%
ASCII 6298
37.8%
None 23
 
0.1%
Compat Jamo 9
 
0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
2 1499
23.8%
/ 1418
22.5%
0 1048
16.6%
1 939
14.9%
615
9.8%
3 195
 
3.1%
9 143
 
2.3%
7 132
 
2.1%
. 64
 
1.0%
8 60
 
1.0%
Other values (5) 185
 
2.9%
Hangul
ValueCountFrequency (%)
556
 
5.4%
525
 
5.1%
448
 
4.3%
425
 
4.1%
396
 
3.8%
395
 
3.8%
344
 
3.3%
330
 
3.2%
330
 
3.2%
301
 
2.9%
Other values (112) 6297
60.9%
None
ValueCountFrequency (%)
· 23
100.0%
Compat Jamo
ValueCountFrequency (%)
9
100.0%
Distinct2421
Distinct (%)84.9%
Missing0
Missing (%)0.0%
Memory size22.4 KiB
2024-05-03T19:30:05.741744image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length45
Median length37
Mean length15.009821
Min length2

Characters and Unicode

Total characters42793
Distinct characters476
Distinct categories11 ?
Distinct scripts3 ?
Distinct blocks5 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique2163 ?
Unique (%)75.9%

Sample

1st row경기도 여행 인식_관광 정보가 잘 제공되고 있다.
2nd row경기도 여행 인식_관광 종사자들이 친절하다
3rd row경기도 여행 인식_교통이 편리하다
4th row경기도 여행 인식_국내 여행지로서 적합하다
5th row경기도 여행 인식_문화, 역사 유적지를 잘 보존하고 있다
ValueCountFrequency (%)
516
 
5.9%
시군별 110
 
1.3%
경기도 89
 
1.0%
만족도 86
 
1.0%
여행 76
 
0.9%
현황 67
 
0.8%
종사자수 66
 
0.8%
여부 61
 
0.7%
55
 
0.6%
총괄 51
 
0.6%
Other values (3117) 7598
86.6%
2024-05-03T19:30:06.658817image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
5934
 
13.9%
_ 1248
 
2.9%
~ 1202
 
2.8%
0 1157
 
2.7%
6 1059
 
2.5%
700
 
1.6%
7 637
 
1.5%
620
 
1.4%
8 599
 
1.4%
592
 
1.4%
Other values (466) 29045
67.9%

Most occurring categories

ValueCountFrequency (%)
Other Letter 27750
64.8%
Space Separator 5934
 
13.9%
Decimal Number 5088
 
11.9%
Connector Punctuation 1248
 
2.9%
Math Symbol 1212
 
2.8%
Open Punctuation 561
 
1.3%
Close Punctuation 561
 
1.3%
Other Punctuation 365
 
0.9%
Dash Punctuation 45
 
0.1%
Uppercase Letter 25
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
700
 
2.5%
620
 
2.2%
592
 
2.1%
577
 
2.1%
542
 
2.0%
521
 
1.9%
502
 
1.8%
502
 
1.8%
464
 
1.7%
459
 
1.7%
Other values (428) 22271
80.3%
Decimal Number
ValueCountFrequency (%)
0 1157
22.7%
6 1059
20.8%
7 637
12.5%
8 599
11.8%
1 550
10.8%
9 422
 
8.3%
2 231
 
4.5%
3 164
 
3.2%
5 143
 
2.8%
4 126
 
2.5%
Uppercase Letter
ValueCountFrequency (%)
C 6
24.0%
T 5
20.0%
K 3
12.0%
S 3
12.0%
V 3
12.0%
D 2
 
8.0%
R 2
 
8.0%
H 1
 
4.0%
Other Punctuation
ValueCountFrequency (%)
· 123
33.7%
, 120
32.9%
/ 79
21.6%
' 26
 
7.1%
? 11
 
3.0%
. 4
 
1.1%
& 2
 
0.5%
Math Symbol
ValueCountFrequency (%)
~ 1202
99.2%
+ 8
 
0.7%
1
 
0.1%
1
 
0.1%
Open Punctuation
ValueCountFrequency (%)
( 553
98.6%
[ 8
 
1.4%
Close Punctuation
ValueCountFrequency (%)
) 553
98.6%
] 8
 
1.4%
Lowercase Letter
ValueCountFrequency (%)
p 2
50.0%
o 2
50.0%
Space Separator
ValueCountFrequency (%)
5934
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 1248
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 45
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 27750
64.8%
Common 15014
35.1%
Latin 29
 
0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
700
 
2.5%
620
 
2.2%
592
 
2.1%
577
 
2.1%
542
 
2.0%
521
 
1.9%
502
 
1.8%
502
 
1.8%
464
 
1.7%
459
 
1.7%
Other values (428) 22271
80.3%
Common
ValueCountFrequency (%)
5934
39.5%
_ 1248
 
8.3%
~ 1202
 
8.0%
0 1157
 
7.7%
6 1059
 
7.1%
7 637
 
4.2%
8 599
 
4.0%
( 553
 
3.7%
) 553
 
3.7%
1 550
 
3.7%
Other values (18) 1522
 
10.1%
Latin
ValueCountFrequency (%)
C 6
20.7%
T 5
17.2%
K 3
10.3%
S 3
10.3%
V 3
10.3%
D 2
 
6.9%
R 2
 
6.9%
p 2
 
6.9%
o 2
 
6.9%
H 1
 
3.4%

Most occurring blocks

ValueCountFrequency (%)
Hangul 27743
64.8%
ASCII 14918
34.9%
None 123
 
0.3%
Compat Jamo 7
 
< 0.1%
Arrows 2
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
5934
39.8%
_ 1248
 
8.4%
~ 1202
 
8.1%
0 1157
 
7.8%
6 1059
 
7.1%
7 637
 
4.3%
8 599
 
4.0%
( 553
 
3.7%
) 553
 
3.7%
1 550
 
3.7%
Other values (25) 1426
 
9.6%
Hangul
ValueCountFrequency (%)
700
 
2.5%
620
 
2.2%
592
 
2.1%
577
 
2.1%
542
 
2.0%
521
 
1.9%
502
 
1.8%
502
 
1.8%
464
 
1.7%
459
 
1.7%
Other values (427) 22264
80.3%
None
ValueCountFrequency (%)
· 123
100.0%
Compat Jamo
ValueCountFrequency (%)
7
100.0%
Arrows
ValueCountFrequency (%)
1
50.0%
1
50.0%

출처
Categorical

HIGH CORRELATION 

Distinct10
Distinct (%)0.4%
Missing0
Missing (%)0.0%
Memory size22.4 KiB
경기도기본통계
1484 
경기도사회조사
660 
경기도청년통계
347 
경기도아동가구주거실태조사
 
102
경기도주요관광지방문객실태조사
 
95
Other values (5)
163 

Length

Max length15
Median length7
Mean length7.7043143
Min length7

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row경기도주요관광지방문객실태조사
2nd row경기도주요관광지방문객실태조사
3rd row경기도주요관광지방문객실태조사
4th row경기도주요관광지방문객실태조사
5th row경기도주요관광지방문객실태조사

Common Values

ValueCountFrequency (%)
경기도기본통계 1484
52.1%
경기도사회조사 660
23.1%
경기도청년통계 347
 
12.2%
경기도아동가구주거실태조사 102
 
3.6%
경기도주요관광지방문객실태조사 95
 
3.3%
경기도콘텐츠산업통계조사 94
 
3.3%
경기도사업체조사 43
 
1.5%
경기도시군단위장래인구추계 19
 
0.7%
주민등록인구통계 5
 
0.2%
경기도경기종합지수 2
 
0.1%

Length

2024-05-03T19:30:06.954210image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-05-03T19:30:07.296166image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
경기도기본통계 1484
52.1%
경기도사회조사 660
23.1%
경기도청년통계 347
 
12.2%
경기도아동가구주거실태조사 102
 
3.6%
경기도주요관광지방문객실태조사 95
 
3.3%
경기도콘텐츠산업통계조사 94
 
3.3%
경기도사업체조사 43
 
1.5%
경기도시군단위장래인구추계 19
 
0.7%
주민등록인구통계 5
 
0.2%
경기도경기종합지수 2
 
0.1%

주기
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct5
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size22.4 KiB
2405 
부정기
435 
월,년
 
6
부정기,년
 
3
 
2

Length

Max length5
Median length1
Mean length1.3135742
Min length1

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row
2nd row
3rd row
4th row
5th row

Common Values

ValueCountFrequency (%)
2405
84.4%
부정기 435
 
15.3%
월,년 6
 
0.2%
부정기,년 3
 
0.1%
2
 
0.1%

Length

2024-05-03T19:30:07.611212image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-05-03T19:30:07.830754image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2405
84.4%
부정기 435
 
15.3%
월,년 6
 
0.2%
부정기,년 3
 
0.1%
2
 
0.1%

시작지점
Real number (ℝ)

HIGH CORRELATION  SKEWED 

Distinct66
Distinct (%)2.3%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean2136.1512
Minimum1950
Maximum200001
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size25.2 KiB
2024-05-03T19:30:08.077696image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum1950
5-th percentile1960
Q11974
median2005
Q32018
95-th percentile2022
Maximum200001
Range198051
Interquartile range (IQR)44

Descriptive statistics

Standard deviation5243.4567
Coefficient of variation (CV)2.4546281
Kurtosis1422.9435
Mean2136.1512
Median Absolute Deviation (MAD)16
Skewness37.734844
Sum6090167
Variance27493838
MonotonicityNot monotonic
2024-05-03T19:30:08.500467image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
2022 215
 
7.5%
2016 208
 
7.3%
2001 195
 
6.8%
2021 195
 
6.8%
1960 189
 
6.6%
1981 163
 
5.7%
2018 128
 
4.5%
2019 86
 
3.0%
1962 75
 
2.6%
2017 73
 
2.6%
Other values (56) 1324
46.4%
ValueCountFrequency (%)
1950 1
 
< 0.1%
1955 1
 
< 0.1%
1957 2
 
0.1%
1958 1
 
< 0.1%
1960 189
6.6%
1961 73
 
2.6%
1962 75
 
2.6%
1963 42
 
1.5%
1964 26
 
0.9%
1965 17
 
0.6%
ValueCountFrequency (%)
200001 2
 
0.1%
2023 60
 
2.1%
2022 215
7.5%
2021 195
6.8%
2020 67
 
2.4%
2019 86
 
3.0%
2018 128
4.5%
2017 73
 
2.6%
2016 208
7.3%
2015 63
 
2.2%

종료시점
Real number (ℝ)

HIGH CORRELATION  SKEWED 

Distinct65
Distinct (%)2.3%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean2492.5479
Minimum1960
Maximum202402
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size25.2 KiB
2024-05-03T19:30:08.965531image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum1960
5-th percentile1964
Q11980
median2014
Q32021
95-th percentile2022
Maximum202402
Range200442
Interquartile range (IQR)41

Descriptive statistics

Standard deviation9874.6209
Coefficient of variation (CV)3.9616574
Kurtosis403.02334
Mean2492.5479
Median Absolute Deviation (MAD)8
Skewness20.117931
Sum7106254
Variance97508137
MonotonicityNot monotonic
2024-05-03T19:30:09.401068image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
2021 411
14.4%
2022 287
 
10.1%
2000 239
 
8.4%
1980 225
 
7.9%
2016 189
 
6.6%
2018 127
 
4.5%
2011 113
 
4.0%
2020 111
 
3.9%
2014 77
 
2.7%
2019 76
 
2.7%
Other values (55) 996
34.9%
ValueCountFrequency (%)
1960 36
1.3%
1961 26
 
0.9%
1962 30
1.1%
1963 16
 
0.6%
1964 44
1.5%
1965 2
 
0.1%
1966 68
2.4%
1967 30
1.1%
1968 33
1.2%
1969 32
1.1%
ValueCountFrequency (%)
202402 3
 
0.1%
201512 1
 
< 0.1%
200912 1
 
< 0.1%
200512 1
 
< 0.1%
200312 1
 
< 0.1%
2047 1
 
< 0.1%
2040 4
 
0.1%
2037 15
 
0.5%
2023 64
 
2.2%
2022 287
10.1%

유의사항
Text

MISSING 

Distinct667
Distinct (%)67.3%
Missing1860
Missing (%)65.2%
Memory size22.4 KiB
2024-05-03T19:30:09.913043image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length1024
Median length238
Mean length106.22603
Min length4

Characters and Unicode

Total characters105270
Distinct characters578
Distinct categories14 ?
Distinct scripts4 ?
Distinct blocks10 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique582 ?
Unique (%)58.7%

Sample

1st rowBASE:전체 응답자/* 본 조사는 「주요관광지점 입장객 통계」의 입장객 수를 기반으로 표준화 가중치를 산출하여, 원 가중치의 합계가 조사 표본 크기와 같아지도록 조정함. 이에 따라 통계산출값 중 전체 사례수와 세부항목의 사례수 합이 일치하지 않을 수 있음.
2nd rowBASE:전체 응답자/* 본 조사는 「주요관광지점 입장객 통계」의 입장객 수를 기반으로 표준화 가중치를 산출하여, 원 가중치의 합계가 조사 표본 크기와 같아지도록 조정함. 이에 따라 통계산출값 중 전체 사례수와 세부항목의 사례수 합이 일치하지 않을 수 있음.
3rd rowBASE:전체 응답자/* 본 조사는 「주요관광지점 입장객 통계」의 입장객 수를 기반으로 표준화 가중치를 산출하여, 원 가중치의 합계가 조사 표본 크기와 같아지도록 조정함. 이에 따라 통계산출값 중 전체 사례수와 세부항목의 사례수 합이 일치하지 않을 수 있음.
4th rowBASE:전체 응답자/* 본 조사는 「주요관광지점 입장객 통계」의 입장객 수를 기반으로 표준화 가중치를 산출하여, 원 가중치의 합계가 조사 표본 크기와 같아지도록 조정함. 이에 따라 통계산출값 중 전체 사례수와 세부항목의 사례수 합이 일치하지 않을 수 있음.
5th rowBASE:전체 응답자/* 본 조사는 「주요관광지점 입장객 통계」의 입장객 수를 기반으로 표준화 가중치를 산출하여, 원 가중치의 합계가 조사 표본 크기와 같아지도록 조정함. 이에 따라 통계산출값 중 전체 사례수와 세부항목의 사례수 합이 일치하지 않을 수 있음.
ValueCountFrequency (%)
739
 
3.5%
자료 584
 
2.7%
시로 438
 
2.1%
2003년 288
 
1.4%
10월 288
 
1.4%
1 287
 
1.3%
19일 273
 
1.3%
261
 
1.2%
않을 248
 
1.2%
일치하지 245
 
1.2%
Other values (3307) 17652
82.9%
2024-05-03T19:30:10.721798image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
20597
 
19.6%
1 2885
 
2.7%
0 2396
 
2.3%
2 2327
 
2.2%
. 1905
 
1.8%
/ 1810
 
1.7%
) 1677
 
1.6%
1591
 
1.5%
1539
 
1.5%
, 1433
 
1.4%
Other values (568) 67110
63.8%

Most occurring categories

ValueCountFrequency (%)
Other Letter 58949
56.0%
Space Separator 20597
 
19.6%
Decimal Number 10372
 
9.9%
Other Punctuation 7141
 
6.8%
Close Punctuation 2337
 
2.2%
Open Punctuation 1613
 
1.5%
Control 1387
 
1.3%
Lowercase Letter 1269
 
1.2%
Uppercase Letter 880
 
0.8%
Math Symbol 392
 
0.4%
Other values (4) 333
 
0.3%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
1591
 
2.7%
1539
 
2.6%
1231
 
2.1%
1202
 
2.0%
1139
 
1.9%
1117
 
1.9%
1106
 
1.9%
1047
 
1.8%
1033
 
1.8%
1012
 
1.7%
Other values (474) 46932
79.6%
Lowercase Letter
ValueCountFrequency (%)
o 275
21.7%
a 256
20.2%
p 252
19.9%
s 234
18.4%
t 69
 
5.4%
m 38
 
3.0%
q 35
 
2.8%
u 35
 
2.8%
g 25
 
2.0%
n 13
 
1.0%
Other values (13) 37
 
2.9%
Uppercase Letter
ValueCountFrequency (%)
B 155
17.6%
E 122
13.9%
A 111
12.6%
S 109
12.4%
C 82
9.3%
D 75
8.5%
I 62
 
7.0%
G 38
 
4.3%
R 21
 
2.4%
F 20
 
2.3%
Other values (12) 85
9.7%
Other Punctuation
ValueCountFrequency (%)
. 1905
26.7%
/ 1810
25.3%
, 1433
20.1%
: 1047
14.7%
; 307
 
4.3%
& 307
 
4.3%
* 191
 
2.7%
· 82
 
1.1%
23
 
0.3%
% 22
 
0.3%
Other values (2) 14
 
0.2%
Decimal Number
ValueCountFrequency (%)
1 2885
27.8%
0 2396
23.1%
2 2327
22.4%
3 1252
12.1%
9 646
 
6.2%
5 272
 
2.6%
4 207
 
2.0%
8 159
 
1.5%
7 122
 
1.2%
6 106
 
1.0%
Math Symbol
ValueCountFrequency (%)
~ 189
48.2%
125
31.9%
+ 37
 
9.4%
= 28
 
7.1%
7
 
1.8%
2
 
0.5%
1
 
0.3%
1
 
0.3%
1
 
0.3%
× 1
 
0.3%
Close Punctuation
ValueCountFrequency (%)
) 1677
71.8%
592
 
25.3%
65
 
2.8%
] 3
 
0.1%
Open Punctuation
ValueCountFrequency (%)
( 954
59.1%
591
36.6%
64
 
4.0%
[ 4
 
0.2%
Other Symbol
ValueCountFrequency (%)
32
82.1%
4
 
10.3%
2
 
5.1%
1
 
2.6%
Space Separator
ValueCountFrequency (%)
20597
100.0%
Control
ValueCountFrequency (%)
1387
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 151
100.0%
Modifier Symbol
ValueCountFrequency (%)
` 123
100.0%
Final Punctuation
ValueCountFrequency (%)
20
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 58941
56.0%
Common 44172
42.0%
Latin 2149
 
2.0%
Han 8
 
< 0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
1591
 
2.7%
1539
 
2.6%
1231
 
2.1%
1202
 
2.0%
1139
 
1.9%
1117
 
1.9%
1106
 
1.9%
1047
 
1.8%
1033
 
1.8%
1012
 
1.7%
Other values (470) 46924
79.6%
Common
ValueCountFrequency (%)
20597
46.6%
1 2885
 
6.5%
0 2396
 
5.4%
2 2327
 
5.3%
. 1905
 
4.3%
/ 1810
 
4.1%
) 1677
 
3.8%
, 1433
 
3.2%
1387
 
3.1%
3 1252
 
2.8%
Other values (39) 6503
 
14.7%
Latin
ValueCountFrequency (%)
o 275
12.8%
a 256
11.9%
p 252
11.7%
s 234
10.9%
B 155
 
7.2%
E 122
 
5.7%
A 111
 
5.2%
S 109
 
5.1%
C 82
 
3.8%
D 75
 
3.5%
Other values (35) 478
22.2%
Han
ValueCountFrequency (%)
3
37.5%
3
37.5%
1
 
12.5%
1
 
12.5%

Most occurring blocks

ValueCountFrequency (%)
Hangul 58931
56.0%
ASCII 44706
42.5%
None 1396
 
1.3%
Arrows 133
 
0.1%
Punctuation 43
 
< 0.1%
CJK Compat 39
 
< 0.1%
Compat Jamo 10
 
< 0.1%
CJK 8
 
< 0.1%
Geometric Shapes 2
 
< 0.1%
Math Operators 2
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
20597
46.1%
1 2885
 
6.5%
0 2396
 
5.4%
2 2327
 
5.2%
. 1905
 
4.3%
/ 1810
 
4.0%
) 1677
 
3.8%
, 1433
 
3.2%
1387
 
3.1%
3 1252
 
2.8%
Other values (65) 7037
 
15.7%
Hangul
ValueCountFrequency (%)
1591
 
2.7%
1539
 
2.6%
1231
 
2.1%
1202
 
2.0%
1139
 
1.9%
1117
 
1.9%
1106
 
1.9%
1047
 
1.8%
1033
 
1.8%
1012
 
1.7%
Other values (469) 46914
79.6%
None
ValueCountFrequency (%)
592
42.4%
591
42.3%
· 82
 
5.9%
65
 
4.7%
64
 
4.6%
1
 
0.1%
× 1
 
0.1%
Arrows
ValueCountFrequency (%)
125
94.0%
7
 
5.3%
1
 
0.8%
CJK Compat
ValueCountFrequency (%)
32
82.1%
4
 
10.3%
2
 
5.1%
1
 
2.6%
Punctuation
ValueCountFrequency (%)
23
53.5%
20
46.5%
Compat Jamo
ValueCountFrequency (%)
10
100.0%
CJK
ValueCountFrequency (%)
3
37.5%
3
37.5%
1
 
12.5%
1
 
12.5%
Geometric Shapes
ValueCountFrequency (%)
2
100.0%
Math Operators
ValueCountFrequency (%)
1
50.0%
1
50.0%

Interactions

2024-05-03T19:30:00.985280image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2024-05-03T19:30:00.483806image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2024-05-03T19:30:01.189744image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2024-05-03T19:30:00.721501image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2024-05-03T19:30:10.896572image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
분야상세분야출처주기시작지점종료시점
분야1.0000.9971.0000.8811.0000.706
상세분야0.9971.0000.9940.9121.0000.767
출처1.0000.9941.0000.9541.0000.714
주기0.8810.9120.9541.0001.0000.810
시작지점1.0001.0001.0001.0001.0000.588
종료시점0.7060.7670.7140.8100.5881.000
2024-05-03T19:30:11.175766image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
주기출처분야
주기1.0000.7040.706
출처0.7041.0000.999
분야0.7060.9991.000
2024-05-03T19:30:11.402091image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
시작지점종료시점분야출처주기
시작지점1.0000.8950.9980.9990.999
종료시점0.8951.0000.5620.5580.938
분야0.9980.5621.0000.9990.706
출처0.9990.5580.9991.0000.704
주기0.9990.9380.7060.7041.000

Missing values

2024-05-03T19:30:01.703010image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-05-03T19:30:02.163208image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

통계표ID분야상세분야통계표명출처주기시작지점종료시점유의사항
0DT_210012_012경기도 주요 관광지 방문객 실태조사경기도 여행인식경기도 여행 인식_관광 정보가 잘 제공되고 있다.경기도주요관광지방문객실태조사20222022BASE:전체 응답자/* 본 조사는 「주요관광지점 입장객 통계」의 입장객 수를 기반으로 표준화 가중치를 산출하여, 원 가중치의 합계가 조사 표본 크기와 같아지도록 조정함. 이에 따라 통계산출값 중 전체 사례수와 세부항목의 사례수 합이 일치하지 않을 수 있음.
1DT_210012_013경기도 주요 관광지 방문객 실태조사경기도 여행인식경기도 여행 인식_관광 종사자들이 친절하다경기도주요관광지방문객실태조사20222022BASE:전체 응답자/* 본 조사는 「주요관광지점 입장객 통계」의 입장객 수를 기반으로 표준화 가중치를 산출하여, 원 가중치의 합계가 조사 표본 크기와 같아지도록 조정함. 이에 따라 통계산출값 중 전체 사례수와 세부항목의 사례수 합이 일치하지 않을 수 있음.
2DT_210012_011경기도 주요 관광지 방문객 실태조사경기도 여행인식경기도 여행 인식_교통이 편리하다경기도주요관광지방문객실태조사20222022BASE:전체 응답자/* 본 조사는 「주요관광지점 입장객 통계」의 입장객 수를 기반으로 표준화 가중치를 산출하여, 원 가중치의 합계가 조사 표본 크기와 같아지도록 조정함. 이에 따라 통계산출값 중 전체 사례수와 세부항목의 사례수 합이 일치하지 않을 수 있음.
3DT_210012_014경기도 주요 관광지 방문객 실태조사경기도 여행인식경기도 여행 인식_국내 여행지로서 적합하다경기도주요관광지방문객실태조사20222022BASE:전체 응답자/* 본 조사는 「주요관광지점 입장객 통계」의 입장객 수를 기반으로 표준화 가중치를 산출하여, 원 가중치의 합계가 조사 표본 크기와 같아지도록 조정함. 이에 따라 통계산출값 중 전체 사례수와 세부항목의 사례수 합이 일치하지 않을 수 있음.
4DT_210012_006경기도 주요 관광지 방문객 실태조사경기도 여행인식경기도 여행 인식_문화, 역사 유적지를 잘 보존하고 있다경기도주요관광지방문객실태조사20222022BASE:전체 응답자/* 본 조사는 「주요관광지점 입장객 통계」의 입장객 수를 기반으로 표준화 가중치를 산출하여, 원 가중치의 합계가 조사 표본 크기와 같아지도록 조정함. 이에 따라 통계산출값 중 전체 사례수와 세부항목의 사례수 합이 일치하지 않을 수 있음.
5DT_210012_009경기도 주요 관광지 방문객 실태조사경기도 여행인식경기도 여행 인식_쇼핑하기 좋다경기도주요관광지방문객실태조사20222022BASE:전체 응답자/* 본 조사는 「주요관광지점 입장객 통계」의 입장객 수를 기반으로 표준화 가중치를 산출하여, 원 가중치의 합계가 조사 표본 크기와 같아지도록 조정함. 이에 따라 통계산출값 중 전체 사례수와 세부항목의 사례수 합이 일치하지 않을 수 있음.
6DT_210012_010경기도 주요 관광지 방문객 실태조사경기도 여행인식경기도 여행 인식_숙박하기 좋다경기도주요관광지방문객실태조사20222022BASE:전체 응답자/* 본 조사는 「주요관광지점 입장객 통계」의 입장객 수를 기반으로 표준화 가중치를 산출하여, 원 가중치의 합계가 조사 표본 크기와 같아지도록 조정함. 이에 따라 통계산출값 중 전체 사례수와 세부항목의 사례수 합이 일치하지 않을 수 있음.
7DT_210012_005경기도 주요 관광지 방문객 실태조사경기도 여행인식경기도 여행 인식_자연 경관이 수려하다경기도주요관광지방문객실태조사20222022BASE:전체 응답자/* 본 조사는 「주요관광지점 입장객 통계」의 입장객 수를 기반으로 표준화 가중치를 산출하여, 원 가중치의 합계가 조사 표본 크기와 같아지도록 조정함. 이에 따라 통계산출값 중 전체 사례수와 세부항목의 사례수 합이 일치하지 않을 수 있음.
8DT_210012_003경기도 주요 관광지 방문객 실태조사경기도 여행인식경기도 여행 인식_종합(100점평균)경기도주요관광지방문객실태조사20222022BASE:전체 응답자/* 본 조사는 「주요관광지점 입장객 통계」의 입장객 수를 기반으로 표준화 가중치를 산출하여, 원 가중치의 합계가 조사 표본 크기와 같아지도록 조정함. 이에 따라 통계산출값 중 전체 사례수와 세부항목의 사례수 합이 일치하지 않을 수 있음.
9DT_210012_002경기도 주요 관광지 방문객 실태조사경기도 여행인식경기도 여행 인식_종합(5점평균)경기도주요관광지방문객실태조사20222022BASE:전체 응답자/* 본 조사는 「주요관광지점 입장객 통계」의 입장객 수를 기반으로 표준화 가중치를 산출하여, 원 가중치의 합계가 조사 표본 크기와 같아지도록 조정함. 이에 따라 통계산출값 중 전체 사례수와 세부항목의 사례수 합이 일치하지 않을 수 있음.
통계표ID분야상세분야통계표명출처주기시작지점종료시점유의사항
2841DT_222007_I014청년통계2023체질량 분포 현황경기도청년통계부정기20222022자료: 국민건강보험공단 「건강검진통계」/주1. 주민등록주소지 기준/주2. 대상기간 : 2022. 1. 1.~ 12. 31. (1년간)
2842DT_222007_B012청년통계2023초혼 신혼부부의 첫째와 둘째자녀 사이의 출산 소요기간경기도청년통계부정기20212021자료: 통계청 「2021년 신혼부부통계」/주1. 둘째자녀가 있는 신혼부부를 대상으로 작성(출생일이 미상이 자녀는 집계에서 제외)/주2. (평균 소요기간) 실제 결혼시작일 이전에 출산한 경우 제외
2843DT_222007_B011청년통계2023초혼 신혼부부의 첫째자녀 출산 소요기간경기도청년통계부정기20212021자료: 통계청 「2021년 신혼부부통계」/주1. 자녀가 있는 신혼부부를 대상으로 작성(출생일이 미상인 자녀는 집계에서 제외)/주2. (평균 소요기간) 실제 결혼시작일 이전에 출산한 경우 제외/주3. 행정구역별 부부의 거처가 다른 경우 거주지역별 가중치(0.5)를 적용
2844DT_222007_J001청년통계2023통근· 통학 실태경기도청년통계부정기20212021자료: 2021년 「경기도 사회조사」/주. 사회조사 대상연령은 만 15세 이상
2845DT_222007_E005청년통계2023학력별 구직 신청 건수경기도청년통계부정기20222022자료: 고용노동부, 「구직 신청 자료」/주1. 2022. 1. 1. ~ 12. 31. 구직 신청 건수 산정/주2. (중졸 이하) 고등학교 중퇴 포함, (고졸) 대학교 재학, 중퇴, 휴학 포함, (대졸 이상) 대학원 포함, (기타) 검정고시, 독학사, 미입력 포함/주3. 19세 이하 각 세별 연령 구분 안됨
2846DT_222007_B0092청년통계2023혼인연령차별 신혼부부 수경기도청년통계부정기20212021자료: 통계청 「2021년 신혼부부통계」/주. 행정구역별 부부의 거처가 다른 경우 거주지역별 가중치(0.5)를 적용
2847DT_222007_B0091청년통계2023혼인연차별 신혼부부 수경기도청년통계부정기20212021자료: 통계청 「2021년 신혼부부통계」/주1. (혼인연차) 해당 기간 중 혼인신고 기준으로 산정/ (1년차) ’20.11.01.~’21.10.31. / (2년차) ’19.11.01.~’20.10.31. / (3년차) ’18.11.01.~’19.10.31. / (4년차) ’17.11.01.~’18.10.31. / (5년차) ’16.11.01.~’17.10.31./주2. 행정구역별 부부의 거처가 다른 경우 거주지역별 가중치(0.5)을 적용
2848DT_222007_B009청년통계2023혼인종류별 신혼부부 수경기도청년통계부정기20212021자료: 통계청 「2021년 신혼부부통계」 /주1. 부부의 거처가 다른 경우 거주지역별 가중치(0.5)를 적용/주2. (신혼부부) 11월 1일 현재 혼인 신고한 지 5년이 경과되지 않은 부부 중에서 혼인관계를 유지 중이며, 국내에 거주(부부 중 1명 이상)하고 있는 부부 /* : 통계표의 수치가 5 이하인 경우는 개인정보 보호를 위하여 *표시로 처리하였음
2849DT_222007_E022청년통계2023훈련직종별 실업자 훈련생경기도청년통계부정기20222022자료: 한국고용정보원 「직업훈련(HRD-Net)」/주1. 2022. 1. 1. ~ 12. 31. (1년간) 훈련 종료된 경기도 거주 실업자 훈련생 산정 /주2. 훈련과정구분 : 내일배움카드, 국가기간전략산업직종훈련/주3. 실업자 훈련과정의 훈련직종 : KECO(한국고용직업분류) 대분류
2850DT_222007_I016청년통계2023흡연 현황경기도청년통계부정기20222022자료: 국민건강보험공단 「건강검진통계」/주1. 주민등록주소지 기준/주2. 대상기간 : 2022. 1. 1.~ 12. 31. (1년간)