Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 562 |
Missing cells | 16 |
Missing cells (%) | 0.5% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.2% |
Total size in memory | 27.0 KiB |
Average record size in memory | 49.2 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 2 |
Text | 2 |
DateTime | 1 |
Dataset
Description | 2023년 7월 31일 기준 광주광역시 소재 여행업 등록 현황입니다. 여행업에는 국내여행업, 국내외여행업, 종합여행업이 있습니다. |
---|---|
URL | https://www.data.go.kr/data/15107985/fileData.do |
데이터기준일자 has constant value "" | Constant |
Dataset has 1 (0.2%) duplicate rows | Duplicates |
업종중분류 is highly overall correlated with 연번 and 1 other fields | High correlation |
지역 is highly overall correlated with 연번 and 1 other fields | High correlation |
연번 is highly overall correlated with 지역 and 1 other fields | High correlation |
지역 is highly imbalanced (93.9%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 04:20:14.349720 |
---|---|
Analysis finished | 2023-12-12 04:20:15.427326 |
Duration | 1.08 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 558 |
---|---|
Distinct (%) | 100.0% |
Missing | 4 |
Missing (%) | 0.7% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 279.5 |
Minimum | 1 |
---|---|
Maximum | 558 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 5.1 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 28.85 |
Q1 | 140.25 |
median | 279.5 |
Q3 | 418.75 |
95-th percentile | 530.15 |
Maximum | 558 |
Range | 557 |
Interquartile range (IQR) | 278.5 |
Descriptive statistics
Standard deviation | 161.225 |
---|---|
Coefficient of variation (CV) | 0.57683362 |
Kurtosis | -1.2 |
Mean | 279.5 |
Median Absolute Deviation (MAD) | 139.5 |
Skewness | 0 |
Sum | 155961 |
Variance | 25993.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
376 | 1 | 0.2% |
370 | 1 | 0.2% |
371 | 1 | 0.2% |
372 | 1 | 0.2% |
373 | 1 | 0.2% |
374 | 1 | 0.2% |
375 | 1 | 0.2% |
377 | 1 | 0.2% |
385 | 1 | 0.2% |
378 | 1 | 0.2% |
Other values (548) | 548 | |
(Missing) | 4 | 0.7% |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
558 | 1 | |
557 | 1 | |
556 | 1 | |
555 | 1 | |
554 | 1 | |
553 | 1 | |
552 | 1 | |
551 | 1 | |
550 | 1 | |
549 | 1 |
지역
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.5 KiB |
광주광역시 | |
---|---|
<NA> | 4 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.9928826 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 광주광역시 |
---|---|
2nd row | 광주광역시 |
3rd row | 광주광역시 |
4th row | 광주광역시 |
5th row | 광주광역시 |
Common Values
Value | Count | Frequency (%) |
광주광역시 | 558 | |
<NA> | 4 | 0.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
광주광역시 | 558 | |
na | 4 | 0.7% |
업종중분류
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.5 KiB |
국내외여행업 | |
---|---|
종합여행업 | |
국내여행업 | |
<NA> | 4 |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 5.5035587 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 종합여행업 |
---|---|
2nd row | 종합여행업 |
3rd row | 종합여행업 |
4th row | 종합여행업 |
5th row | 종합여행업 |
Common Values
Value | Count | Frequency (%) |
국내외여행업 | 287 | |
종합여행업 | 157 | |
국내여행업 | 114 | 20.3% |
<NA> | 4 | 0.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
국내외여행업 | 287 | |
종합여행업 | 157 | |
국내여행업 | 114 | 20.3% |
na | 4 | 0.7% |
업체명
Text
Distinct | 471 |
---|---|
Distinct (%) | 84.4% |
Missing | 4 |
Missing (%) | 0.7% |
Memory size | 4.5 KiB |
Length
Max length | 16 |
---|---|
Median length | 14 |
Mean length | 8.5035842 |
Min length | 2 |
Characters and Unicode
Total characters | 4745 |
---|---|
Distinct characters | 360 |
Distinct categories | 10 ? |
Distinct scripts | 4 ? |
Distinct blocks | 5 ? |
Unique
Unique | 386 ? |
---|---|
Unique (%) | 69.2% |
Sample
1st row | (합)아시아 관광 여행사 |
---|---|
2nd row | 주)그린여행사 |
3rd row | 주식회사 퍼니허니문 |
4th row | (주)광주도시여행청 |
5th row | (유)금호관광여행사 |
Value | Count | Frequency (%) |
주식회사 | 74 | 10.0% |
유한회사 | 31 | 4.2% |
여행사 | 22 | 3.0% |
투어 | 9 | 1.2% |
앤 | 4 | 0.5% |
세계로 | 4 | 0.5% |
tour | 3 | 0.4% |
여행 | 3 | 0.4% |
협동조합 | 3 | 0.4% |
주)임해관광 | 3 | 0.4% |
Other values (489) | 583 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 389 | 8.2% |
) | 350 | 7.4% |
( | 347 | 7.3% |
사 | 282 | 5.9% |
행 | 222 | 4.7% |
여 | 220 | 4.6% |
어 | 186 | 3.9% |
투 | 185 | 3.9% |
181 | 3.8% | |
회 | 107 | 2.3% |
Other values (350) | 2276 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 3803 | |
Close Punctuation | 350 | 7.4% |
Open Punctuation | 347 | 7.3% |
Space Separator | 181 | 3.8% |
Uppercase Letter | 29 | 0.6% |
Lowercase Letter | 20 | 0.4% |
Decimal Number | 8 | 0.2% |
Other Punctuation | 4 | 0.1% |
Other Symbol | 2 | < 0.1% |
Dash Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 389 | 10.2% |
사 | 282 | 7.4% |
행 | 222 | 5.8% |
여 | 220 | 5.8% |
어 | 186 | 4.9% |
투 | 185 | 4.9% |
회 | 107 | 2.8% |
유 | 102 | 2.7% |
광 | 93 | 2.4% |
이 | 92 | 2.4% |
Other values (314) | 1925 |
Uppercase Letter
Value | Count | Frequency (%) |
T | 4 | |
C | 4 | |
S | 3 | |
O | 3 | |
K | 3 | |
A | 2 | 6.9% |
B | 2 | 6.9% |
R | 1 | 3.4% |
I | 1 | 3.4% |
U | 1 | 3.4% |
Other values (5) | 5 |
Lowercase Letter
Value | Count | Frequency (%) |
o | 5 | |
u | 4 | |
r | 4 | |
g | 2 | 10.0% |
t | 1 | 5.0% |
f | 1 | 5.0% |
a | 1 | 5.0% |
e | 1 | 5.0% |
l | 1 | 5.0% |
Decimal Number
Value | Count | Frequency (%) |
1 | 3 | |
8 | 2 | |
4 | 1 | 12.5% |
3 | 1 | 12.5% |
5 | 1 | 12.5% |
Other Punctuation
Value | Count | Frequency (%) |
& | 2 | |
. | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 350 |
Open Punctuation
Value | Count | Frequency (%) |
( | 347 |
Space Separator
Value | Count | Frequency (%) |
181 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 2 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 3799 | |
Common | 891 | 18.8% |
Latin | 49 | 1.0% |
Han | 6 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 389 | 10.2% |
사 | 282 | 7.4% |
행 | 222 | 5.8% |
여 | 220 | 5.8% |
어 | 186 | 4.9% |
투 | 185 | 4.9% |
회 | 107 | 2.8% |
유 | 102 | 2.7% |
광 | 93 | 2.4% |
이 | 92 | 2.4% |
Other values (310) | 1921 |
Latin
Value | Count | Frequency (%) |
o | 5 | 10.2% |
u | 4 | 8.2% |
T | 4 | 8.2% |
C | 4 | 8.2% |
r | 4 | 8.2% |
S | 3 | 6.1% |
O | 3 | 6.1% |
K | 3 | 6.1% |
g | 2 | 4.1% |
A | 2 | 4.1% |
Other values (14) | 15 |
Common
Value | Count | Frequency (%) |
) | 350 | |
( | 347 | |
181 | ||
1 | 3 | 0.3% |
8 | 2 | 0.2% |
& | 2 | 0.2% |
. | 2 | 0.2% |
- | 1 | 0.1% |
4 | 1 | 0.1% |
3 | 1 | 0.1% |
Han
Value | Count | Frequency (%) |
玩 | 2 | |
旅 | 1 | |
行 | 1 | |
社 | 1 | |
樂 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 3797 | |
ASCII | 940 | 19.8% |
CJK | 4 | 0.1% |
None | 2 | < 0.1% |
CJK Compat Ideographs | 2 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 389 | 10.2% |
사 | 282 | 7.4% |
행 | 222 | 5.8% |
여 | 220 | 5.8% |
어 | 186 | 4.9% |
투 | 185 | 4.9% |
회 | 107 | 2.8% |
유 | 102 | 2.7% |
광 | 93 | 2.4% |
이 | 92 | 2.4% |
Other values (309) | 1919 |
ASCII
Value | Count | Frequency (%) |
) | 350 | |
( | 347 | |
181 | ||
o | 5 | 0.5% |
u | 4 | 0.4% |
T | 4 | 0.4% |
C | 4 | 0.4% |
r | 4 | 0.4% |
S | 3 | 0.3% |
O | 3 | 0.3% |
Other values (25) | 35 | 3.7% |
None
Value | Count | Frequency (%) |
㈜ | 2 |
CJK
Value | Count | Frequency (%) |
玩 | 2 | |
行 | 1 | |
社 | 1 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
旅 | 1 | |
樂 | 1 |
소재지도로명주소
Text
Distinct | 431 |
---|---|
Distinct (%) | 77.2% |
Missing | 4 |
Missing (%) | 0.7% |
Memory size | 4.5 KiB |
Length
Max length | 70 |
---|---|
Median length | 50 |
Mean length | 31.623656 |
Min length | 19 |
Characters and Unicode
Total characters | 17646 |
---|---|
Distinct characters | 322 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 331 ? |
---|---|
Unique (%) | 59.3% |
Sample
1st row | 광주광역시 동구 천변우로 339, 1708호 (수기동) |
---|---|
2nd row | 광주광역시 동구 문화전당로26번길 지하 7, 문화전당역 104-A호 (광산동) |
3rd row | 광주광역시 동구 서석로 1, 2층 (불로동) |
4th row | 광주광역시 동구 서석로85번길 24, 1층 (궁동) |
5th row | 광주광역시 동구 천변우로 339, 제일오피스텔빌딩 101동 905호 (수기동) |
Value | Count | Frequency (%) |
광주광역시 | 558 | 15.6% |
서구 | 182 | 5.1% |
동구 | 135 | 3.8% |
북구 | 100 | 2.8% |
광산구 | 83 | 2.3% |
2층 | 80 | 2.2% |
치평동 | 78 | 2.2% |
남구 | 58 | 1.6% |
1층 | 57 | 1.6% |
3층 | 37 | 1.0% |
Other values (870) | 2199 |
Most occurring characters
Value | Count | Frequency (%) |
3010 | 17.1% | |
광 | 1236 | 7.0% |
동 | 735 | 4.2% |
1 | 666 | 3.8% |
로 | 606 | 3.4% |
구 | 601 | 3.4% |
주 | 595 | 3.4% |
시 | 585 | 3.3% |
역 | 566 | 3.2% |
) | 562 | 3.2% |
Other values (312) | 8484 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 9872 | |
Space Separator | 3010 | 17.1% |
Decimal Number | 2917 | 16.5% |
Close Punctuation | 562 | 3.2% |
Open Punctuation | 562 | 3.2% |
Other Punctuation | 498 | 2.8% |
Dash Punctuation | 127 | 0.7% |
Uppercase Letter | 75 | 0.4% |
Lowercase Letter | 23 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
광 | 1236 | 12.5% |
동 | 735 | 7.4% |
로 | 606 | 6.1% |
구 | 601 | 6.1% |
주 | 595 | 6.0% |
시 | 585 | 5.9% |
역 | 566 | 5.7% |
층 | 255 | 2.6% |
호 | 241 | 2.4% |
서 | 233 | 2.4% |
Other values (267) | 4219 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 8 | |
S | 8 | |
E | 6 | 8.0% |
A | 6 | 8.0% |
O | 6 | 8.0% |
Y | 6 | 8.0% |
C | 6 | 8.0% |
J | 5 | 6.7% |
H | 5 | 6.7% |
P | 4 | 5.3% |
Other values (8) | 15 |
Lowercase Letter
Value | Count | Frequency (%) |
y | 4 | |
t | 3 | |
e | 3 | |
a | 3 | |
n | 3 | |
i | 2 | |
s | 1 | 4.3% |
h | 1 | 4.3% |
d | 1 | 4.3% |
u | 1 | 4.3% |
Decimal Number
Value | Count | Frequency (%) |
1 | 666 | |
2 | 465 | |
3 | 338 | |
0 | 306 | |
4 | 264 | 9.1% |
5 | 213 | 7.3% |
6 | 181 | 6.2% |
7 | 169 | 5.8% |
8 | 165 | 5.7% |
9 | 150 | 5.1% |
Other Punctuation
Value | Count | Frequency (%) |
, | 497 | |
. | 1 | 0.2% |
Space Separator
Value | Count | Frequency (%) |
3010 |
Close Punctuation
Value | Count | Frequency (%) |
) | 562 |
Open Punctuation
Value | Count | Frequency (%) |
( | 562 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 127 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 9872 | |
Common | 7676 | |
Latin | 98 | 0.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
광 | 1236 | 12.5% |
동 | 735 | 7.4% |
로 | 606 | 6.1% |
구 | 601 | 6.1% |
주 | 595 | 6.0% |
시 | 585 | 5.9% |
역 | 566 | 5.7% |
층 | 255 | 2.6% |
호 | 241 | 2.4% |
서 | 233 | 2.4% |
Other values (267) | 4219 |
Latin
Value | Count | Frequency (%) |
B | 8 | 8.2% |
S | 8 | 8.2% |
E | 6 | 6.1% |
A | 6 | 6.1% |
O | 6 | 6.1% |
Y | 6 | 6.1% |
C | 6 | 6.1% |
J | 5 | 5.1% |
H | 5 | 5.1% |
P | 4 | 4.1% |
Other values (19) | 38 |
Common
Value | Count | Frequency (%) |
3010 | ||
1 | 666 | 8.7% |
) | 562 | 7.3% |
( | 562 | 7.3% |
, | 497 | 6.5% |
2 | 465 | 6.1% |
3 | 338 | 4.4% |
0 | 306 | 4.0% |
4 | 264 | 3.4% |
5 | 213 | 2.8% |
Other values (6) | 793 | 10.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 9872 | |
ASCII | 7774 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
3010 | ||
1 | 666 | 8.6% |
) | 562 | 7.2% |
( | 562 | 7.2% |
, | 497 | 6.4% |
2 | 465 | 6.0% |
3 | 338 | 4.3% |
0 | 306 | 3.9% |
4 | 264 | 3.4% |
5 | 213 | 2.7% |
Other values (35) | 891 | 11.5% |
Hangul
Value | Count | Frequency (%) |
광 | 1236 | 12.5% |
동 | 735 | 7.4% |
로 | 606 | 6.1% |
구 | 601 | 6.1% |
주 | 595 | 6.0% |
시 | 585 | 5.9% |
역 | 566 | 5.7% |
층 | 255 | 2.6% |
호 | 241 | 2.4% |
서 | 233 | 2.4% |
Other values (267) | 4219 |
데이터기준일자
Date
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.2% |
Missing | 4 |
Missing (%) | 0.7% |
Memory size | 4.5 KiB |
Minimum | 2023-07-31 00:00:00 |
---|---|
Maximum | 2023-07-31 00:00:00 |
연번 | 업종중분류 | |
---|---|---|
연번 | 1.000 | 0.967 |
업종중분류 | 0.967 | 1.000 |
업종중분류 | 지역 | |
---|---|---|
업종중분류 | 1.000 | 1.000 |
지역 | 1.000 | 1.000 |
연번 | 지역 | 업종중분류 | |
---|---|---|---|
연번 | 1.000 | 1.000 | 0.965 |
지역 | 1.000 | 1.000 | 1.000 |
업종중분류 | 0.965 | 1.000 | 1.000 |
연번 | 지역 | 업종중분류 | 업체명 | 소재지도로명주소 | 데이터기준일자 | |
---|---|---|---|---|---|---|
0 | 1 | 광주광역시 | 종합여행업 | (합)아시아 관광 여행사 | 광주광역시 동구 천변우로 339, 1708호 (수기동) | 2023-07-31 |
1 | 2 | 광주광역시 | 종합여행업 | 주)그린여행사 | 광주광역시 동구 문화전당로26번길 지하 7, 문화전당역 104-A호 (광산동) | 2023-07-31 |
2 | 3 | 광주광역시 | 종합여행업 | 주식회사 퍼니허니문 | 광주광역시 동구 서석로 1, 2층 (불로동) | 2023-07-31 |
3 | 4 | 광주광역시 | 종합여행업 | (주)광주도시여행청 | 광주광역시 동구 서석로85번길 24, 1층 (궁동) | 2023-07-31 |
4 | 5 | 광주광역시 | 종합여행업 | (유)금호관광여행사 | 광주광역시 동구 천변우로 339, 제일오피스텔빌딩 101동 905호 (수기동) | 2023-07-31 |
5 | 6 | 광주광역시 | 종합여행업 | 유한회사 현진여행사 | 광주광역시 동구 천변우로 361-1, 2층 (수기동) | 2023-07-31 |
6 | 7 | 광주광역시 | 종합여행업 | 남도마실길 | 광주광역시 동구 구성로 187-2, 403호 (금남로5가) | 2023-07-31 |
7 | 8 | 광주광역시 | 종합여행업 | 동명문화트래블 협동조합 | 광주광역시 동구 중앙로252번길 11-1 (동명동) | 2023-07-31 |
8 | 9 | 광주광역시 | 종합여행업 | (주)여행가는날 | 광주광역시 동구 문화전당로23번길 26, 문화전당역 오펠리움 1314호 (금동) | 2023-07-31 |
9 | 10 | 광주광역시 | 종합여행업 | (주)월드항공여행사 | 광주광역시 동구 제봉로82번길 13-2 (서석동) | 2023-07-31 |
연번 | 지역 | 업종중분류 | 업체명 | 소재지도로명주소 | 데이터기준일자 | |
---|---|---|---|---|---|---|
552 | 553 | 광주광역시 | 국내여행업 | 주식회사 아리수여행사 | 광주광역시 광산구 광산로 111 (송정동) | 2023-07-31 |
553 | 554 | 광주광역시 | 국내여행업 | 주식회사 자이언트투어 | 광주광역시 광산구 풍영로200번길 59, 301호 (장덕동, 한도빌딩) | 2023-07-31 |
554 | 555 | 광주광역시 | 국내여행업 | 주식회사 포플레이 | 광주광역시 광산구 앰코로 35, 폭스존 217호 (쌍암동) | 2023-07-31 |
555 | 556 | 광주광역시 | 국내여행업 | 케이솔루션투어 | 광주광역시 광산구 산월로3번길 13 (월계동,1층) | 2023-07-31 |
556 | 557 | 광주광역시 | 국내여행업 | 투어나우 | 광주광역시 광산구 앰코로 35, 폭스존 129호 (쌍암동) | 2023-07-31 |
557 | 558 | 광주광역시 | 국내여행업 | 투어디자인(주) | 광주광역시 광산구 임방울대로826번길 7-36 (쌍암동) | 2023-07-31 |
558 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
559 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
560 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
561 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
연번 | 지역 | 업종중분류 | 업체명 | 소재지도로명주소 | 데이터기준일자 | # duplicates | |
---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 4 |