Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 109 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 6.4 KiB |
Average record size in memory | 60.2 B |
Variable types
Numeric | 3 |
---|---|
Categorical | 3 |
Text | 1 |
Dataset
Description | 일련번호,FAQ구분,FAQ구분명,대분류코드,대분류명,질문,수정일시 |
---|---|
Author | 120다산콜재단 |
URL | https://data.seoul.go.kr/dataList/OA-1127/S/1/datasetView.do |
FAQ구분명 is highly overall correlated with 대분류코드 and 2 other fields | High correlation |
FAQ구분 is highly overall correlated with 대분류코드 and 2 other fields | High correlation |
대분류코드 is highly overall correlated with FAQ구분 and 2 other fields | High correlation |
대분류명 is highly overall correlated with 대분류코드 and 2 other fields | High correlation |
일련번호 has unique values | Unique |
질문 has unique values | Unique |
Reproduction
Analysis started | 2023-12-11 07:18:52.408613 |
---|---|
Analysis finished | 2023-12-11 07:18:54.319271 |
Duration | 1.91 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
일련번호
Real number (ℝ)
UNIQUE
 
Distinct | 109 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 289596.61 |
Minimum | 289412 |
---|---|
Maximum | 289825 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.1 KiB |
Quantile statistics
Minimum | 289412 |
---|---|
5-th percentile | 289435.4 |
Q1 | 289502 |
median | 289568 |
Q3 | 289695 |
95-th percentile | 289802.6 |
Maximum | 289825 |
Range | 413 |
Interquartile range (IQR) | 193 |
Descriptive statistics
Standard deviation | 117.84972 |
---|---|
Coefficient of variation (CV) | 0.0004069444 |
Kurtosis | -1.1592923 |
Mean | 289596.61 |
Median Absolute Deviation (MAD) | 97 |
Skewness | 0.29540769 |
Sum | 31566030 |
Variance | 13888.556 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
289427 | 1 | 0.9% |
289458 | 1 | 0.9% |
289519 | 1 | 0.9% |
289517 | 1 | 0.9% |
289516 | 1 | 0.9% |
289515 | 1 | 0.9% |
289510 | 1 | 0.9% |
289498 | 1 | 0.9% |
289495 | 1 | 0.9% |
289491 | 1 | 0.9% |
Other values (99) | 99 |
Value | Count | Frequency (%) |
289412 | 1 | |
289415 | 1 | |
289427 | 1 | |
289431 | 1 | |
289434 | 1 | |
289435 | 1 | |
289436 | 1 | |
289437 | 1 | |
289443 | 1 | |
289448 | 1 |
Value | Count | Frequency (%) |
289825 | 1 | |
289808 | 1 | |
289806 | 1 | |
289805 | 1 | |
289804 | 1 | |
289803 | 1 | |
289802 | 1 | |
289801 | 1 | |
289800 | 1 | |
289799 | 1 |
FAQ구분
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 2.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1004.0 B |
J | |
---|---|
S | |
F |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | F |
---|---|
2nd row | F |
3rd row | F |
4th row | F |
5th row | F |
Common Values
Value | Count | Frequency (%) |
J | 44 | |
S | 44 | |
F | 21 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
j | 44 | |
s | 44 | |
f | 21 |
FAQ구분명
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 2.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1004.0 B |
자치구 업무메뉴얼 | |
---|---|
서울시 업무매뉴얼 | |
FAQ |
Length
Max length | 9 |
---|---|
Median length | 9 |
Mean length | 7.8440367 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | FAQ |
---|---|
2nd row | FAQ |
3rd row | FAQ |
4th row | FAQ |
5th row | FAQ |
Common Values
Value | Count | Frequency (%) |
자치구 업무메뉴얼 | 44 | |
서울시 업무매뉴얼 | 44 | |
FAQ | 21 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
자치구 | 44 | |
업무메뉴얼 | 44 | |
서울시 | 44 | |
업무매뉴얼 | 44 | |
faq | 21 |
대분류코드
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 21 |
---|---|
Distinct (%) | 19.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 22214188 |
Minimum | 22213012 |
---|---|
Maximum | 22214339 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.1 KiB |
Quantile statistics
Minimum | 22213012 |
---|---|
5-th percentile | 22214024 |
Q1 | 22214080 |
median | 22214161 |
Q3 | 22214330 |
95-th percentile | 22214339 |
Maximum | 22214339 |
Range | 1327 |
Interquartile range (IQR) | 250 |
Descriptive statistics
Standard deviation | 171.67006 |
---|---|
Coefficient of variation (CV) | 7.7279465 × 10-6 |
Kurtosis | 18.889764 |
Mean | 22214188 |
Median Absolute Deviation (MAD) | 137 |
Skewness | -2.9538234 |
Sum | 2.4213465 × 109 |
Variance | 29470.608 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
22214080 | 14 | |
22214161 | 12 | |
22214047 | 10 | 9.2% |
22214061 | 7 | 6.4% |
22214024 | 7 | 6.4% |
22214335 | 7 | 6.4% |
22214339 | 7 | 6.4% |
22214324 | 6 | 5.5% |
22214327 | 6 | 5.5% |
22214330 | 5 | 4.6% |
Other values (11) | 28 |
Value | Count | Frequency (%) |
22213012 | 1 | 0.9% |
22214000 | 2 | 1.8% |
22214024 | 7 | |
22214047 | 10 | |
22214061 | 7 | |
22214080 | 14 | |
22214095 | 2 | 1.8% |
22214136 | 1 | 0.9% |
22214153 | 3 | 2.8% |
22214161 | 12 |
Value | Count | Frequency (%) |
22214339 | 7 | |
22214338 | 4 | |
22214337 | 2 | 1.8% |
22214335 | 7 | |
22214332 | 3 | |
22214331 | 1 | 0.9% |
22214330 | 5 | |
22214329 | 5 | |
22214328 | 4 | |
22214327 | 6 |
대분류명
Categorical
HIGH CORRELATION
 
Distinct | 21 |
---|---|
Distinct (%) | 19.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1004.0 B |
사회보장과복지 | |
---|---|
제조건설과개발 | |
기업과경제 | |
수송및교통 | |
지역개발 | |
Other values (16) |
Length
Max length | 7 |
---|---|
Median length | 6 |
Mean length | 5.2293578 |
Min length | 2 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 2.8% |
Sample
1st row | 일반공공행정 |
---|---|
2nd row | 문화와여가 |
3rd row | 문화와여가 |
4th row | 문화와여가 |
5th row | 문화와여가 |
Common Values
Value | Count | Frequency (%) |
사회보장과복지 | 14 | |
제조건설과개발 | 12 | |
기업과경제 | 10 | 9.2% |
수송및교통 | 7 | 6.4% |
지역개발 | 7 | 6.4% |
문화와여가 | 7 | 6.4% |
구정일반 | 7 | 6.4% |
일반공공행정 | 6 | 5.5% |
산업중소기업 | 6 | 5.5% |
교육 | 5 | 4.6% |
Other values (11) | 28 |
Length
Value | Count | Frequency (%) |
사회보장과복지 | 14 | |
제조건설과개발 | 12 | |
기업과경제 | 10 | 9.2% |
수송및교통 | 7 | 6.4% |
지역개발 | 7 | 6.4% |
문화와여가 | 7 | 6.4% |
구정일반 | 7 | 6.4% |
일반공공행정 | 6 | 5.5% |
산업중소기업 | 6 | 5.5% |
사회복지 | 5 | 4.6% |
Other values (11) | 28 |
질문
Text
UNIQUE
 
Distinct | 109 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1004.0 B |
Length
Max length | 202 |
---|---|
Median length | 45 |
Mean length | 26.587156 |
Min length | 3 |
Characters and Unicode
Total characters | 2898 |
---|---|
Distinct characters | 387 |
Distinct categories | 13 ? |
Distinct scripts | 3 ? |
Distinct blocks | 5 ? |
Unique
Unique | 109 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | [시ㆍ구정외 타기관 관련 상담] 고용노동부 [일자리 안정자금] |
---|---|
2nd row | 서대문문화체육회관 FAQ |
3rd row | 서대문구립인조잔디구장 FAQ |
4th row | 궁동체육관 FAQ |
5th row | 홍제배드민턴장 FAQ |
Value | Count | Frequency (%) |
및 | 12 | 2.2% |
10 | 1.9% | |
한예종 | 8 | 1.5% |
관련 | 8 | 1.5% |
추진 | 7 | 1.3% |
업무 | 6 | 1.1% |
관리 | 6 | 1.1% |
유치 | 6 | 1.1% |
총괄 | 5 | 0.9% |
테스트db_교육용 | 4 | 0.7% |
Other values (399) | 467 |
Most occurring characters
Value | Count | Frequency (%) |
591 | 20.4% | |
동 | 56 | 1.9% |
사 | 54 | 1.9% |
지 | 48 | 1.7% |
업 | 47 | 1.6% |
시 | 41 | 1.4% |
) | 40 | 1.4% |
( | 40 | 1.4% |
관 | 36 | 1.2% |
대 | 33 | 1.1% |
Other values (377) | 1912 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1956 | |
Space Separator | 591 | 20.4% |
Decimal Number | 99 | 3.4% |
Uppercase Letter | 69 | 2.4% |
Close Punctuation | 56 | 1.9% |
Open Punctuation | 56 | 1.9% |
Other Punctuation | 32 | 1.1% |
Lowercase Letter | 19 | 0.7% |
Connector Punctuation | 11 | 0.4% |
Dash Punctuation | 4 | 0.1% |
Other values (3) | 5 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 56 | 2.9% |
사 | 54 | 2.8% |
지 | 48 | 2.5% |
업 | 47 | 2.4% |
시 | 41 | 2.1% |
관 | 36 | 1.8% |
대 | 33 | 1.7% |
서 | 32 | 1.6% |
리 | 31 | 1.6% |
구 | 27 | 1.4% |
Other values (320) | 1551 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 9 | |
D | 8 | |
S | 8 | |
F | 6 | |
A | 6 | |
O | 5 | |
Q | 4 | 5.8% |
W | 4 | 5.8% |
C | 4 | 5.8% |
E | 3 | 4.3% |
Other values (8) | 12 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 4 | |
e | 2 | |
r | 2 | |
o | 2 | |
t | 1 | 5.3% |
p | 1 | 5.3% |
y | 1 | 5.3% |
u | 1 | 5.3% |
l | 1 | 5.3% |
n | 1 | 5.3% |
Other values (3) | 3 |
Decimal Number
Value | Count | Frequency (%) |
1 | 29 | |
2 | 24 | |
0 | 14 | |
3 | 12 | |
8 | 6 | 6.1% |
4 | 4 | 4.0% |
6 | 3 | 3.0% |
5 | 3 | 3.0% |
9 | 2 | 2.0% |
7 | 2 | 2.0% |
Other Punctuation
Value | Count | Frequency (%) |
. | 13 | |
? | 6 | |
/ | 5 | 15.6% |
: | 5 | 15.6% |
? | 3 | 9.4% |
Close Punctuation
Value | Count | Frequency (%) |
) | 40 | |
] | 16 | 28.6% |
Open Punctuation
Value | Count | Frequency (%) |
( | 40 | |
[ | 16 | 28.6% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3 | |
- | 1 | 25.0% |
Space Separator
Value | Count | Frequency (%) |
591 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 11 |
Math Symbol
Value | Count | Frequency (%) |
~ | 3 |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 1 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1956 | |
Common | 854 | |
Latin | 88 | 3.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 56 | 2.9% |
사 | 54 | 2.8% |
지 | 48 | 2.5% |
업 | 47 | 2.4% |
시 | 41 | 2.1% |
관 | 36 | 1.8% |
대 | 33 | 1.7% |
서 | 32 | 1.6% |
리 | 31 | 1.6% |
구 | 27 | 1.4% |
Other values (320) | 1551 |
Latin
Value | Count | Frequency (%) |
B | 9 | 10.2% |
D | 8 | 9.1% |
S | 8 | 9.1% |
F | 6 | 6.8% |
A | 6 | 6.8% |
O | 5 | 5.7% |
Q | 4 | 4.5% |
W | 4 | 4.5% |
a | 4 | 4.5% |
C | 4 | 4.5% |
Other values (21) | 30 |
Common
Value | Count | Frequency (%) |
591 | ||
) | 40 | 4.7% |
( | 40 | 4.7% |
1 | 29 | 3.4% |
2 | 24 | 2.8% |
] | 16 | 1.9% |
[ | 16 | 1.9% |
0 | 14 | 1.6% |
. | 13 | 1.5% |
3 | 12 | 1.4% |
Other values (16) | 59 | 6.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1955 | |
ASCII | 934 | |
None | 6 | 0.2% |
Punctuation | 2 | 0.1% |
Compat Jamo | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
591 | ||
) | 40 | 4.3% |
( | 40 | 4.3% |
1 | 29 | 3.1% |
2 | 24 | 2.6% |
] | 16 | 1.7% |
[ | 16 | 1.7% |
0 | 14 | 1.5% |
. | 13 | 1.4% |
3 | 12 | 1.3% |
Other values (43) | 139 | 14.9% |
Hangul
Value | Count | Frequency (%) |
동 | 56 | 2.9% |
사 | 54 | 2.8% |
지 | 48 | 2.5% |
업 | 47 | 2.4% |
시 | 41 | 2.1% |
관 | 36 | 1.8% |
대 | 33 | 1.7% |
서 | 32 | 1.6% |
리 | 31 | 1.6% |
구 | 27 | 1.4% |
Other values (319) | 1550 |
None
Value | Count | Frequency (%) |
- | 3 | |
? | 3 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 1 |
Punctuation
Value | Count | Frequency (%) |
‘ | 1 | |
’ | 1 |
수정일시
Real number (ℝ)
Distinct | 95 |
---|---|
Distinct (%) | 87.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2.0191995 × 1013 |
Minimum | 2.0180107 × 1013 |
---|---|
Maximum | 2.0200506 × 1013 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.1 KiB |
Quantile statistics
Minimum | 2.0180107 × 1013 |
---|---|
5-th percentile | 2.0180459 × 1013 |
Q1 | 2.0190425 × 1013 |
median | 2.0190812 × 1013 |
Q3 | 2.0200213 × 1013 |
95-th percentile | 2.0200414 × 1013 |
Maximum | 2.0200506 × 1013 |
Range | 2.0398998 × 1010 |
Interquartile range (IQR) | 9.7879809 × 109 |
Descriptive statistics
Standard deviation | 7.0351052 × 109 |
---|---|
Coefficient of variation (CV) | 0.0003484106 |
Kurtosis | -0.98554061 |
Mean | 2.0191995 × 1013 |
Median Absolute Deviation (MAD) | 9.3109916 × 109 |
Skewness | -0.26740566 |
Sum | 2.2009275 × 1015 |
Variance | 4.9492705 × 1019 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20190425161723 | 10 | 9.2% |
20190805092932 | 3 | 2.8% |
20190816162025 | 2 | 1.8% |
20190805092900 | 2 | 1.8% |
20190917181020 | 2 | 1.8% |
20190522102043 | 1 | 0.9% |
20200414143921 | 1 | 0.9% |
20190910173023 | 1 | 0.9% |
20200414143350 | 1 | 0.9% |
20200414142827 | 1 | 0.9% |
Other values (85) | 85 |
Value | Count | Frequency (%) |
20180107143914 | 1 | |
20180128093739 | 1 | |
20180213145025 | 1 | |
20180222162224 | 1 | |
20180416135603 | 1 | |
20180420125311 | 1 | |
20180518094914 | 1 | |
20180518095015 | 1 | |
20180518095546 | 1 | |
20180618153148 | 1 |
Value | Count | Frequency (%) |
20200506142228 | 1 | |
20200506102624 | 1 | |
20200414143921 | 1 | |
20200414143350 | 1 | |
20200414143121 | 1 | |
20200414142827 | 1 | |
20200414112704 | 1 | |
20200408141117 | 1 | |
20200408095734 | 1 | |
20200325155934 | 1 |
일련번호 | FAQ구분 | FAQ구분명 | 대분류코드 | 대분류명 | 수정일시 | |
---|---|---|---|---|---|---|
일련번호 | 1.000 | 0.471 | 0.471 | 0.444 | 0.721 | 0.029 |
FAQ구분 | 0.471 | 1.000 | 1.000 | 0.938 | 0.956 | 0.219 |
FAQ구분명 | 0.471 | 1.000 | 1.000 | 0.938 | 0.956 | 0.219 |
대분류코드 | 0.444 | 0.938 | 0.938 | 1.000 | 1.000 | 0.214 |
대분류명 | 0.721 | 0.956 | 0.956 | 1.000 | 1.000 | 0.584 |
수정일시 | 0.029 | 0.219 | 0.219 | 0.214 | 0.584 | 1.000 |
FAQ구분명 | 대분류명 | FAQ구분 | |
---|---|---|---|
FAQ구분명 | 1.000 | 0.710 | 1.000 |
대분류명 | 0.710 | 1.000 | 0.710 |
FAQ구분 | 1.000 | 0.710 | 1.000 |
일련번호 | 대분류코드 | 수정일시 | FAQ구분 | FAQ구분명 | 대분류명 | |
---|---|---|---|---|---|---|
일련번호 | 1.000 | -0.157 | 0.137 | 0.303 | 0.303 | 0.332 |
대분류코드 | -0.157 | 1.000 | 0.242 | 0.690 | 0.690 | 0.915 |
수정일시 | 0.137 | 0.242 | 1.000 | 0.203 | 0.203 | 0.335 |
FAQ구분 | 0.303 | 0.690 | 0.203 | 1.000 | 1.000 | 0.710 |
FAQ구분명 | 0.303 | 0.690 | 0.203 | 1.000 | 1.000 | 0.710 |
대분류명 | 0.332 | 0.915 | 0.335 | 0.710 | 0.710 | 1.000 |
일련번호 | FAQ구분 | FAQ구분명 | 대분류코드 | 대분류명 | 질문 | 수정일시 | |
---|---|---|---|---|---|---|---|
0 | 289427 | F | FAQ | 22214327 | 일반공공행정 | [시ㆍ구정외 타기관 관련 상담] 고용노동부 [일자리 안정자금] | 20190522102043 |
1 | 289434 | F | FAQ | 22214061 | 문화와여가 | 서대문문화체육회관 FAQ | 20190816162025 |
2 | 289435 | F | FAQ | 22214061 | 문화와여가 | 서대문구립인조잔디구장 FAQ | 20190816162025 |
3 | 289436 | F | FAQ | 22214061 | 문화와여가 | 궁동체육관 FAQ | 20190816162014 |
4 | 289437 | F | FAQ | 22214061 | 문화와여가 | 홍제배드민턴장 FAQ | 20190816162034 |
5 | 289472 | F | FAQ | 22214153 | 재난과안전 | 양천생활안전체험교육관 | 20180213145025 |
6 | 289473 | F | FAQ | 22214061 | 문화와여가 | 금천 나도스타 노래부르기 대회 (어린이날 행사) | 20190502160033 |
7 | 289492 | F | FAQ | 22214061 | 문화와여가 | 브라보 서초문화버스 (셔틀버스) 운행 | 20181128120932 |
8 | 289612 | F | FAQ | 22214339 | 지역개발 | 마곡산업단지 내 문화시설 건립 | 20180910131534 |
9 | 289648 | F | FAQ | 22214328 | 농림해양수산 | 서울반려동물교육센터 | 20190408175105 |
일련번호 | FAQ구분 | FAQ구분명 | 대분류코드 | 대분류명 | 질문 | 수정일시 | |
---|---|---|---|---|---|---|---|
99 | 289675 | S | 서울시 업무매뉴얼 | 22214335 | 수송및교통 | [사업종료] 서울시 상습불법주차 발생장소 (중점단속 구간 193개소) | 20200224113053 |
100 | 289676 | S | 서울시 업무매뉴얼 | 22214332 | 문화체육관광 | 관광약자를 위한 접근성 개선 지원 사업 | 20180719152605 |
101 | 289683 | S | 서울시 업무매뉴얼 | 22214324 | 산업중소기업 | 제로페이 (서울페이 / 소상공인 결제 서비스) | 20200506102624 |
102 | 289691 | S | 서울시 업무매뉴얼 | 22214324 | 산업중소기업 | 폭염에 따른 에너지빈곤층 냉방물품 지원사업 | 20200318153525 |
103 | 289708 | S | 서울시 업무매뉴얼 | 22214330 | 사회복지 | 서울형 갭이어(Gap-year) 지원사업_청년인생설계학교 | 20200224080201 |
104 | 289712 | S | 서울시 업무매뉴얼 | 22214339 | 지역개발 | 서울식물원(Seoul Botanic Park) | 20200506142228 |
105 | 289714 | S | 서울시 업무매뉴얼 | 22214330 | 사회복지 | 서울시 중증 뇌병변장애인 일회용품 구입비 지원 | 20200312153044 |
106 | 289756 | S | 서울시 업무매뉴얼 | 22214332 | 문화체육관광 | 시월 정동축제 | 20200129102726 |
107 | 289789 | S | 서울시 업무매뉴얼 | 22214337 | 보건 | 서울시민 건강 한마당 | 20200302132817 |
108 | 289825 | S | 서울시 업무매뉴얼 | 22214338 | 환경보호 | [수도사업소]공공문자 알림서비스 | 20191217185410 |